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(57) Abstract: The invention relates to a comprehensive 
method for efficiently configuring and reconfiguring, 
especially for the running time and also during data 
processing, a collection of modules, whose function and 
networking can be modified, by means of one or more 
intercommunicating configuration units. The precise 
configuration in a complex technical transformation is, in 
particular, in the foreground. This includes the description 
of the state automatons, of the communications structures, 
of the reconfiguration execution, and of the protocols 
required each time. The invention is characterized by 
the ability to effect a permanent as well as overlapping 
reconfiguration without the occurrence of blockings or error 
functions, particularly in the data processing. 

(57) Zusammenfassung: Es wird ein umfassendes 
Verfahren zur effizienten Konfiguration und Rekonfigu- 
ration, insbesondere zur Laufzeit und auch wahrend der 
Datenverarbeitung, einer Araarnmlung von in ihrer Funktion 
und Vernetzung veranderbaren Baugruppen mittels einer 
oder mehrerer miteinander kommunizierender Konfigura- 
tionseinheiten vorgeschlagen. Im Vordergrund steht dabei 
insbesondere die genaue Ausgestaltung in einer komplexen 
technischen Umsetzung. Dies beinhaltet die Beschreibung 
der Zustandsautomaten, der Kommunikationsstrukturen, 
des Rekonfigurationsablaufes und der jeweils erforderlichen 
Protokolle. Wesentliches Merkmal ist die Moglichkeit zur 
standigen auch ineinander iiberlappenden Rekonfiguran'on, 
ohne daB es zu Blockierungen oder Fehlfunktionen, 
insbesondere der Datenverarbeitung kommt. 
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Pipeline CT-Protok611e und -Kommunikatiori 

Die vorliegende Erfindung befafit sich mit Verfahren, die eine 
effiziente Konfiguration und Rekonf iguration einer Oder 
mehrerer rekonf igurierbarer Baugruppen durch jeweils eine oder 
mehrere Konf igurationseinheiten (CT) bei hoheri Frequenzen ' 
ermdglicht. Dabei wird beschrieben, wie zur St eue rung mehrerer 
CTs eine effiziente und synchronisierte Vernetziing aufgebaut 
werden kann. 

Der Begriff Baugruppe bzw. Zelle umfafit klassische FPGA- 
Zellen, Bussysteme, Speicher, Peripherie ebenso wie ALUs und 
Rechenwerke von Prozessoren. Hingewiesen wird in diesem 
Zusammenhang auf die Definitionen des gleichen 
Anmelders/Zessionars. Insbesondere wird jede Art von 
konf igurierbaren und rekonf igurierbaren Elementen 
grundsatzlich als Baugruppe verstanden. Far 
Parallelrechnersystem kann eine Baugruppe als kompletter 
Knoten jedweder Funktion (insbesondere jedoch Rechen-, 
Speicher- und Dateniibertragungs-funktionen) verstanden werden. 

Das beschriebene Verfahren ist insbesondere ftir integrierte 
Bausteine mit einer Mehrzahl von ein^ oder mehrdimensional 
angeordneten Baugruppen, die direkt oder durch ein Bussystem 
miteinander verbunden sind, anwendbar. 

Zur Gattung der Bausteine :zahlen systolische Arrays, neuronale 
Netze, Mehrprozessor Systeme, Prozessoren mit mehreren 
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Rectienwerken und logischen Zellen, ebenso wie bekannte 
Bausteirie . der Gattuiig FPGA, DPGA, XPUTER, etc . . 
In der . nachfolgenden Beschreibung werden Bausteine einer 
Architektur verwendet, der en Rechenwerke und Bussysteme frei 
konfigurierbar sind. Die Architektur ist in DE4416881, sowie 
PACT02, PACT08, PACT10, PACT 13 bereits ver6f f entlicht und wird 
im folgenden VPU genannt. Diese Architektur besteht aus 
beliebigen arithraetischen, logischen (auch Speicher) oder 
kommunikativen (10) Zellen (PAEs), die zu einer ein- oder 
mehrdimensionalen Matrix (PA) angeordnet sein konnen, wobei 
die Matrix unterschiedliche beliebig ausgestaltete Zellen 
aufweisen kann, auch die Bussysteme werden dabei als Zellen 
verstanden. Der Matrix als ganzes oder Teilen davon zugeordnet 
ist eine Konfigurationseinheit (CT), die die Vernetzung und 
Funktion des PA beeinfluBt. 

Eine besondere Eigenschaft von VPUs ist die automatische und 
deadlockfreie Umkonfiguration zur Laufzeit. Dazu notwendige 
Protokolle und Verfahren sind aus PACT04, 05, 08, 10, 13 bekannt, 
die durch Bezugnahme vollumfanglich eingegliedert sind. Die 
Vereffentlichungsnuimaer zu diesen internen Aktenzeichen finderi 
sich im Anhang. 

1. Grundzustande von PAEs und Busprotokoll der Konf iguration 

Jeder PAE sind ZustMnde zugeordnet, die die Konfigurierbarkeit 
beeinflussen. Ob diese Zustande lokal kodiert sind oder durch 
eine oder mehrere Schaltwerke verwaltet werden, insbesondere 
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die CT selbst, ist dabei unerhebiicK. Eine PAE kennti 
raindestens zwei Zustande: . 7 

„not. configured" In diesem Zustand ist die PAE inaktiv und 
verarbeitet keine Daten und/oder Trigger. Insbesondere nimmt 
sie keinerlei Daten und/oder Trigger entgegen und generiert 
auch keine Daten und/oder Trigger. Es kdnnen lediglich 
konfigurationsbezogene Daten und/oder Trigger aufgenommen 
und/oder verarbeitet werden. Die PAE ist vollkommen neutral 
und darf konfiguriert werden. Die MSglichkeit zur 
Initialisierung der Register fiir zu verarbeitende Daten 
und/oder Trigger insbesondere durch die CT in diesem Zustand 
sei aber hiermit erwahnt. 

„configured" Die Funktion und Vernetzung der PAE ist 
konfiguriert. Die PAE verarbeitet und generiert zu 
verarbeitende Daten und/oder Trigger. Solche Zustande konnen 
auch mehrfach weitgehend unabh^ngig voneinander in 
eigenstMndigen Teilen einer PAE enthalten sein. 

Sofern sich die hier relevante Trennung zwischen Daten 
und/oder Trigger fiir die Verarbeitung einerseits und Daten 
und/oder Trigger fttr die Konf iguration einer oder mehrere . 
Zellen andererseits nachfolgend aus dem Zusammenhang ergibt 
wird sie nicht durchgehend explizit angeftthrt. 

Die CT sendet bei der Konf iguration zusammen mit einem 
gttltigen Konf igurationwort (KW) ein Signal , das die Giiltigkeit 
anzeigt (RDY) . Dies kann entfallen f wenn die Gtlltigkeit auf 
andere Weise sichergestellt ist f zum Beispiel bei 
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kontinuierlichem Senden oder durch eine Kodielrung ira KW. 
Weiterhin ist im allgemeinen in einem KW die Adresse der zu 
konfigurierenden PAE kodiert. 

Eine PAE entscheidet nach nachfolgend und in den unter Bezug 
genommenen Anmeldungen beschriebenen Kriterien, ob sie in der 
Lage ist, die KW anzunehmen und ihre Konf iguration zu 
verandern oder ob die Datenverarbeitung nicht durch eine neue 
Konf iguration unterbrochen oder verfalscht werden darf. In 
jedem Fall wird die Information, ob Konf igurationen angenommen 
werden oder nicht, an die CT weitergeleitet, falls die 
Entscheidung nicht schon dort stattfindet. Folgendes Protokoll 
ware moglich: Sofern eine PAE die Konf iguration akzeptiert, 
sendet sie die Quittung ACK (acknowledge) an die CT. Sofern 
die Konf iguration abgelehnt wird, zeigt eine PAE dies durch 
Senden von RE J (reject) der CT an. 

Innerhalb der datenverarbeitenden Elemente (PAEs) wird von 
diesem bzw. diesen entschieden, ob sie umkonfiguriert werden 
k6nnen, da die Datenverarbeitung beendet ist, oder ob sie noch 
Daten verarbeiten. Zudem werden durch unkonf igurierte PAEs 
keinerlei Daten verfalscht. 

2. Deadlock-Freihelt. und Korrektheit der Daten 
2 .1 FILMO-Prinzip 

Wichtig ist nun die effiziente Verwaltung einer Vielzahl von 
Konf igurationen, die jeweils aus einem oder mehreren KW und 
eventuell weiteren Steuerbefehlen bestehen und iiberlappend auf 
das PA konfiguriert werden konnen. Dies liegt daran dafi 
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bftmals eine girofie Entfernurig zwischeri der CT urid der bzw. deh 
zii kbnfigurierenden Zellisn besteht, was bei der Obertraguhg 
von Konfigurationen nachteilig ist. Gleichzeitig wird yon der 
Technologie sichergestellt, daB durch eine Rekonf iguration 
keine Daten oder Zustande verfaischt werden. Dazu werden 
folgende Regeln definiert, die das FILMO-Prinzip genannt 
werden: 

a) PAEs, die aktuell Daten verarbeiten, werden nicht 

umkonf iguriert. Eine Umkonf iguration soil erst stattfinden, 
wenn die Datenverarbeitung vollstandig abgeschlossen ist 
oder sichergestellt 1st, daB keine weitere 
Datenverarbeitung mehr erforderlich ist. (Erkiarung: Das 
Umkonf igurieren von PAEs, die aktuell Daten verarbeiten 
oder auf noch ausstehende Daten warten, ftthrt zur 
fehlerhaften Berechnung oder dem Verlust von Daten.) 

b) Der Zustand einer PAE soil sich nicht wahrend eines FILMO 
Durchlaufes von „konf iguriert" auf „unkonfiguriert" andern. 
Nachfolgend wird zusatzlich zum Verfahren nach PACT10 ein 
besonderes zusatzliches Verfahren beschrieben, das 
Ausnahnten zulSBt (Explizit/Implizit LOCK) . Dies hat 
folgende Bewandnis auf sich: Wenn eine SubConf verstanden 
wird als eine MEnge von Konf igurationsworten, die zu 
gegebener Zeit bzw. zu gegebenem Zweck geraeinsam in das 
Zellarray hineinkonf iguriert werden sollen, kann eine 
Situation auftreten, wo zwei verschiedene SubConf (A, 
D)dieselben Ressourcen teilen sollen, insbesondere eine PAE 
X. SubConf A liegt z.B. zeitlich vor SubConf D. Somit muB 
SubConf A die Resourcen vor SubConf D belegen. Wenn nun PAE 
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X zum korifigurationszeitpuhkt vbh SubConf A hbch 
„konfiguriert" ist> aber vor der Konf iguration yon .SubConf ' 
D den Zustand auf „unkonfiguriert" wechselt, kann ohne 
besondere MaBnahmen eine Deadlock Situation entstehen, wenn 
nSmlich SubConf A die PAE X nicht mehr konfigurieren kann 
und SubConf D zB nur PAE x belegt, aber die rest lichen 
Resourcen, die bereits von SubConf A belegt sind nicht mehr 
konfigurieren kann. Weder SubConf A noch SubConf D konnen 
ausgeftihrt werden. Es entsttinde ein Deadlock, 
c) Eine SubConf soil alle zu ihr gehdrenden PAEs entweder 
erfolgreich kohf iguriert bder alloziiert haben oder eine : 
Zuriickweisung (REJ) erhalten haben, bevor die nachfolgende 
SubConf konfiguriert wird. Dies gilt jedoch nur, wenn die 
beiden Konf igurationen ganz Oder teilweise dieselben 
Ressourcen teilen. Gibt es keinen Ressourcenkonf likt, 
kdnnen beide SiabConf unabhangig voneinander konfiguriert 
werden. Auch wenn bei einer SubConf PAEs die Konf iguration 
verweigerten (REJ) , wird die Konf iguration der 
nachfolgenden SubConf durchgeftihrt . Da sich der Status von 
PAEs wahrend eines FILMO Durchlaufes nicht andert (LOCK, 
gema3 Abschnitt b) ) ist sichergestellt, dafi in der 
nachfolgenden Konf iguration keine PAEs konfiguriert werden, 
die die vorhergehende Konf iguration benStigt hatte. 
ErklSrung: Wttrde eine spatere zu konf igurierende SubConf 
die PAEs einer zuvor zu konf igurierenden SubConf 
alloziiern, tritt ein Deadlock ein, da keine SubConf mehr 
vollstandig konfiguriert werden kann. 
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' d) innerhalb eiher SubConf kahn es erfofderlich sein/cLaifi 
... bestirnmte PAEs in einer : bestimmten Reihenfolge konfiguriert 
bzw. ges.tartet werden. Erklarung: Eine PAE darf 
beipielsweise erst auf einen Bus aufgeschaltet werden, 
nachdem der Bus auch ftir die SubConf konf iguriert ist. Eine 
Aufschaltung auf einen fremden Bus wtirde zur Verarbeitung 
falscher Daten fiihren. 
e) Bei bestimmten Algorithmen muJi die Reihenfolge der 
{Configuration von SubConf gegebenenfalls exakt der 
Reihenfolge der bei der CT eirigehenden Trigger entsprebhen. 
. Geht beispielsweise der Trigger/ der die Konfiguratioh von 
SubConf 1 auslost, vor dem Trigger, der die Konf iguration 
von SubConf 3 auslost, ein, mu5 SubConf 1 vollst^ndig 
konfiguriert sein, bevor SubConf 3 konfiguriert werden 
darf. Wird die Reihenfolge der Trigger vertauscht, kann 
dies, je nach Algorithmus zu einer fehlerhaften Abfolge der 
Teilgraphen (SubConf, vgl. PACT13) fUhren. 
Verfahren die weitgehend vielen Oder alien der oben genannten 
Anforderungen gentigen, sind aus PACT 05 und PACT10 bekannt. 

Die Verwaltung der Konfigurationen, ihr zeitliches Timing und 
die Anordnung und Ausbildung der zugehorigen Bauelemente, 
insbesondere der Konf iguratibnsregister usw. hat sich jedoch 
als filr die beschriebene Technik fundamental herausgestellt 
und es sollen daher noch mGgliche Verbesserungen des bekannten 
Standes der Technik erOrtert werden. 
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Die Auf gabe der vorliegenden Erf indurig besteht dairiri, Neues 
far die gewerbliche Anwendung bereitzustellen. 

Die LSsung dieser Aufgabe wird in unabhangiger Form 
beansprucht. Bevorzugte Ausfahrungsformen finden sich in den 
Unteranspriichen . 

Dm bedarfsweise die Anforderungen e) sicherzustellen, wird 
vorgeschlagen, eingehende Trigger, die auf den Status einer 
SubConf bzw. einer Zelle und/oder einer Rekonf igurierbarkeit 
bezogeri sind/ mittels eihes einfachen - insbesohdere der CT 
zugeordneten - FIFOs in der korrekten Reihenfolge zu 
speichern. Jeder FIFO-Eintrag enthait die in einem Takt 
eingegangenen Trigger, wobei insbesondere alle in einem Takt 
eingegangenen Trigger gespeichert werden konnen. Treten keine 
Trigger auf, wird auch kein FIFO-Eintrag generiert. Die CT 
arbeitet den FIFO in der Reihenfolge der eingehenden Trigger 
ab. Enthait ein Eintrag mehrere Trigger, arbeitet die CT 
wahlweise entweder (i) priorisiert oder (ii) unpriorisiert 
zunachst jeden Trigger einzeln ab, bevor der nachste FIFO- 
Eintrag bearbeitet wird. Da ein Trigger gewdhnlicherweise nur 
einmal pro Konfigurationen an die CT gesendet wird, ist es far 
gewohnlich ausreichend, die Maximaltiefe des FIFOs auf die 
Menge aller an die CT verdrahteten Triggerleitungen 
festzusetzen. Als alternatives Verfahren kann auch ein Time- 
Stamp-Protokoll entsprechend PACT 18 angewendet werden. 

Aus PACT10 sind zwei grundlegende FILMO-Arten bekannt: 
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Separater FILMO: Der FILMO ist als separater Speichef 
ausgefUhrt und vom nbrmalen CT-Speicher, der die SubConf \ 
cached getrennt. Nur KWs die nicht in das PA konf iguriert . 
werden konnten, werden in den FILMO kopiert. 
Integrierter FILMO: Der FILMO ist im CT-Speicher integriert. 
KWs die nicht konfiguriert werden konnten werden mittels Flags 
und Pointern verwaltet. 

Die nachfolgend beschriebenen erf indungsgemSBen Verfahren sind 
entweder auf beide FILMO-Arten oder eine bestimmte Art 
anwendbar. 

2.2 Differentielle Rekonf iguration 

Bei vielen Algorithiaen ist es sinnvoll wahrend des Betriebes 
aufgrund bestiinmter Ereignisse, die durch Trigger oder 
zeitliche Abstimmung reprasentiert werden, die Konf iguration 
nur minimal zu Sndern, ohne daB die Konf iguration der PAEs 
komplett gelOscht wird. In den meisten Fallen betrifft dies 
die Verschaltung der Bussysteme oder bestimmte Konstanten. 
Soli beispielsweise nur eine Konstante geandert werden, ist es 
sinnvoll, ein.KW in die betreffende PAE schreiben zu kdnnen, 
ohne daB die PAE im Zustand „unkonf iguriert" ist. Dies 
vermindert die Menge an zu tibertragenden Kof igurationsdaten 
und ist daher vorteilhaft. Erreicht werden kann dies mit einem 
Konfigurationsmodus „dif f erentielle Rekonf iguration* . Dabei 
enthait das KW beim Schreiben des KW kodiert oder explizit 
die Information DIFFERENTIAL . DIFFERENTIAL zeigt an, daft das 
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KW ah eirie bereits korif igurierte ?AE geseridet werden soil. Die 
Akzeptaiiz der dif ferentielleri .Konf iguration und die 
Quittierung ist genau umgekehrt zur s normalen Konf iguration: . 
Eine konf igurierte PAE nimmt das KW entgegen und sendet ein 
ACK. Eine unkonf igurierte PAE verweigert die Annahme des KW 
und sendet RE J, da Voraussetzung ftir DIFFERENTIAL eine 
konf igurierte PAE ist. 

Es gibt nun verschiedene Mdglichkeiten, die dif fereentielle 
Rekonf iguration dur chzuf tihren . Entweder es wird die 
dif ferentiele Rekonf iguration ohne Rticksicht auf den 
tatsachlich z.B. in einer Zelle ablaufenden 
Datenverarbeitungs-Prozefi erzwungen; dann ist es 
wtlnschenswert, eine exakte Synchronisation mit den 
Datenverarbeitungen zu gewMhrleisten, was durch entsprechende 
Gestaltung und Auslegung des Programes geschehen kann. Urn den 
Programmierer von dieser Aufgabe zu entlasten, kann aber die 
differentielle Rekonfigurierbarkeit auch abhSngig gemacht 
werden von anderen Ereignissen, beispielsweise dem Vorliegen 
eines bestimmten Zustandes in einer anderen oder der partiell 
umzukonf igurierenden Zelle. Eine besonders bevorzugte Variante 
ist daher, die Konf igurationsdaten, insbesondere 
dif ferentiellen Konf igurationsdaten in oder bei der Zelle zu 
speichem, etwa in einem dedizierten Register und dann 
abhangig von einem bestimmten Zustand den Registerinhalt 
abuzrufen bzw. in die Zelle einzulesen. Dies kann z.B. durch 
Umschalten eines Multiplexers geschehen. 
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Auch kSnneh die nachfolgerid beschriebierien Methoden der Wave 
Re konfiguration verwendet werden. ^ J^enfalls ist es :-■ 
gegebenenfalls sinnvqll, . eine differentielle .Konf iguration yon 
dem Erfolg (ACK/REJ) einer zuvor normal durchgefuhrten 
Konf iguration abh^ngig zu machen. Mit anderen Worten wird die 
differentielle Konfiguration nur nach Eintreffen des ACKs far 
die vorhergehende nicht Dif ferentiellen durchgeftihrt . 

Eine besonders bevorzugte Variante der Synchronisation der 
dif fefentehtiellen Kofiguration i^t allgemein anwendbar und 
zwar unabhangig davbh, wie vieie uriterschiedliche 
differentielle Konf igurationen tatsMchlich benotigt werden. 
Dies wird ermSglicht, indem die differentielle Konfiguration 
nicht lokal vorgespeichert wird, sondern mit einer ersten 
Zelle auf das Erkennen eines bestimmten Zustandes, 
beispielsweise eines Dateneingabe-Endes oder dergl., ein 
Signal generiert wird, das die dif ferentiell 

umzukonfigurierende Zelle anhalt* Ein solches Signal kann ein 
STOP-Signal sein. Nach oder gleichzeitig mit dem Anhalten der 
Datenverarbeitung in der dif ferentiell umzukonfigurierenden 
Zelle wird. ein Signal an die CT gesendet, das zum 
differentiellen Umkonf igurieren der angehalten Zelle 
auffordert. Dieses Auf f orderungssignal zum differentiellen 
Umkofigurieren kann insbesondere von jener Zelle eirzeugt und 
gesendet werden, welche auch das STOP_Signal generiert. Die CT 
wird dann die zur differentiellen Rekonf igurierung 
erforderlichen Daten an die angehaltene Zelle senden und so 
die differentielle Rekonf igurierung bewirken. Nach der 



11 



WO 02/13000 



PCT/EP01/06703 



diff erentielien Rekonf igurierurig wird der STOP_Modus 
aufgehoben; dies kahn insbesoridere durch die CT ve rani aft t 
werden. Es sei darauf hingewiesen, dafl bei dem Verfahren der 
dif ferentiellen Rekonf igurierung auch Cache-Techniken 
einsetzbar sind. 



3. Aufgabe der Trigger 

In VPU Bausteinen werden zur Obertragung einfacher 
Informationen wie nachfolgend beispielhaft aufgelistet 
bevorzugt sogenannte Trigger verwendet. Trigger werden mittels 
eines beliebigen insbesondere konfigurierbaren Bussystems 
(Netzwerk) ttbertragen. Quelle und Ziel eines Triggers sind 
programmierbar . 

Eine Vielzahl von Triggern kann innerhalb eines Bausteins 
gleichzeitig ttbertragen werden. In besonderen Ausgestaltungen 
ist aufcer der direkten Obertragung von einer Quelle zu einem 
Ziel auch die Obertragung einer Quelle an mehrere Ziele oder 
mehrerer Quellen an ein Ziel moglich. 

Trigger ttbertragen vor allem, jedoch nicht ausschlieBlich 
* Statusinformationen yon Rechenwerken (ALUs) wie 

- Carry 

- Division by Zero 

- Zero 

- Negativ 

- Under-/Overflow 
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* Ergebnisse von Vergleichen 

.-*" 'ri^bit Informationen (fQr kleirie n) 

* Interruptanforderungen, die intern oder extern, 
generiert werden 

* Blockier- und Freigabeauf trSge 

* Anforderungen von Konfigurationen 

Trigger werden von beliebigeri Zellen generiert und werden 
durch beliebige Ereignisse in den einzelnen Zellen ausgelSst. 
Beispielsweise kann das Status^- und/oder Flagregister von ALUs 
oder Prozessoren nach dem Stand der Technik zur Generierung 
von Triggern verwendet werden. Auch k5nnen Trigger von einer 
CT und/oder einer externen Einheit, die aufierhalb des 
Zellarrays oder des Bausteines angeordnet ist, generiert 
werden. 

Trigger werden von beliebigen Zellen empfangen und auf 
beliebige Art ausgewertet. Insbesondere konnen Trigger von 
einer CT oder einer externen Einheit, die aufierhalb des 
Zellarrays oder des Bausteines angeordnet ist 7 ausgewertet 
werden . 

Ein wesentlicher Einsatzbereich von Triggern ist das 
Synchronisieren und Ansteuern von bedingten Ausfiihrungen 
und/oder Ablauf steuerungen im Array, die z.B. durch Sequenzern 
realisierbar sind, sowie deren Inf ormationsaustausch. 

3.1 Semantxk von Triggern 

Trigger werden beispielsweise far folgende Aktionen innerhalb 
von PAEs verwendet: 
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STEP: Ausftihren einer Operation innerhaib einer PAE bei 
Eiritref f en des Triggers 

GO: Ausftihren von Operationen innerhaib einer PAE bei 
Eintreffen des Triggers. Die Ausftihrung wird durch STOP 
angehalten. 

STOP: Stoppen der mit GO gestarteten Ausftihrung; vgl. hierzu 
auch die vorstehenden Ausfuhrungen zum STOP-Signal 
LOCAL RESET: Stoppen der Ausftihrung uhd Obergang vom Status 
^allocated" oder „conf igured" in den Status „not configured". 
WAVE: Anhalten der Ausftihrung von Operationen und Laden einer 
von der CT zu ladenden sog. Wave-Rekonf iguration. 
Bei einer WAVE-Rekonf iguaration soil eine oder mehrere PAEs 
nachfolgend zum Durchlaufen des Endes eines Datenpaketes 
rekonfiguriert werden. Es soli dann bevorzugt direkt und 
unmitellbar nach der Rekonf iguration, die auch als 
differentielle Rekonf iguration erfolgen kann, die Verarbeitung 
eines weiteren Datenpaektes erfolgen. Beispielsweise soil ein 
erstes Audiodatenpaket mit ersten Filterkoeefizienten 
verarbeitet werden; nach Durchlaufien des ersten 
Audiodatenpaketes soli eine partielle REkonf igurierung 
erfolgen und es soli dann mit eierim zweiten 

Filterkoeffizientensatz ein unterschiedliches Audiodatenpaket 
verarbeite werden. Dazu konnen die ne^uen 

Rekonf igurationsdaten, z.B. die zweiten Filterkoef fizienten, 
in oder bei der Zelle abgelegt werden und auf das Erkennen des 
Endes des ersten Datenpaketes die Umkonf igurierung automatisch 
veranlafit werden, ohne dafi hierftir z.B. noch das weitere 
Eingreifen einer CT oder anderen externen Steuereinheit 
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erforderlich sein mufc. Das Erkennen des Endes des ersten 
Datenpaketes 'bzw* des Zeitpunktes. an dem die Reconfiguration 
durchgeftihrt werden soil, kann durch das Generieren eines : : 
Wave-Rekonfigurations-Triggers geschehen. Dieser kann z.B. in 
einer jeweils ein Datenende erkennenden Zelle erzeugt werden; 
eine Umkonf igurierung lauf t dann mit dem Trigger von Zelle zu 
Zelle, sobald diese die Verarbeitung des ersten Datenpaketes 
jeweils abgeschlossen haben, vergleichbar dem Diirchlaufen 
einer LA OLA durch ein FuBballstadium. Dazu kann eine einzelne 
Zelle den Trigger generieren und z.B. an eine erste Zelle 
senden, urn ihr anzuzeigen, dafi das Ende eines ersten Paketes 
durchlauft. Diese von der Wave-Triggergenerierzelle 
angesprochene erste umzukonfigurierende Zelle reicht 
insbesondere zeitgleich mit den aus den letzten Daten des 
ersten Paketes hergeleiteten Ergebnissen, die an eine Oder 
mehrere nachfolgend verarbeitende Zellen gesendet werden, an 
diese nachfolgend verarbeitenden Zellen auch das Wave- 
Triggersignal weiter. Das Wavetriggersignal kann dabei zudem 
insbesondere auch an solche Zellen gesendet bzw. 
weitergeleitet werden, die derzeit nicht mit der Verarbeitung 
des ersten Datenpaketes befafit sind und/oder keine aus den 
letzten Daten hergeleiteten Ergebnisse erhalten. Dann wird die 
erste yon der Wave-Triggersignalgenerienden Zelle 
angesprochene umzukonfigurierende Zelle umkonf iguriert und 
nimmt die Verarbeitung der Daten des zweiten Datenpaketes auf ; 
wahrend dieser Zeit sind nachfolgende Zellen noch beschaftigt 
mit der Bearbeitung des ersten Datenpaketes. Es sei erwahnt, 
daft die Wave-TRiggersignalgenerierende Zelle nicht nur eine 
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einzelne Zelle ansprectien kann, sondern mehrere 
umzukonfigurierride Zellen. So kann sich eine lawinenartige 
Fortpflanzung der Wave-Konf iguration ergeben. 

Sobald die Wave-Rekonf iguration vollstandig konfiguriert ist, 
wird die Datenverarbeitung fortgesetzt. Bei WAVE kann 
selektiert werden, ob sofort nach vollstcindiger Konf iguration 
die Datenverarbeitung fortgesetzt wird, oder auf das 
Eintreffen eines STEP oder GO gewartet wird. 

SELECT: Selektiert einen Eingangs-Bus zur Weiterleitung an den 
Ausgang. Beispiel: Entweder der Bus A oder B soil auf einen 
Ausgang geschaltet werden. Durch SELECT wird die Stellung des 
Multiplexers und damit die Auswahl des Busses gewahlt. 

Trigger werden beispielsweise fiir folgende Aktionen innerhalb 
von CTs verwendet: 

CONFIG: Eine Konf iguration soli durch die CT in das PA 
konfiguriert werden. 

PRELOAD: Eine Konf iguration soil von der CT in deren lokalen 
Speicher vorgeladen werden. Dadurch mufi die Konf iguration 
nicht erst bei Eintreffen von CONFIG geladen werden. Es 
entsteht ein der Effekt eines vorhersagbaren cachings. 
CLEAR; Eine Konf iguration soli von der CT aus deren Speicher 
gel6scht werden. 

Eingehende Trigger ref erenzieren dabei eine bestimmte 

Konf iguration. Das entsprechende Verfahren wird nachfolgend 

beschrieben. 
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Die Semaritik ist nicht einem Trigger-Signal iiu Netzwerk 
ziigeordriet. Vielmehr reprSsentiert ein Trigger lediglich einen 
Zustand. Wie dieser Zustand von der jeweiligen empf angenden 
PAE genutzt wird, ist in der empf angenden PAE konf iguriert . 
Mit arideren Worten, die sendende PAE sendet lediglich ihren 
Zustand, die empfangende PAE generiert die fur sie gtiltige 
Semantik. Empfangen mehrere PAEs einen Trigger, kann in jeder 
PAE eine andere Semantik verwendet werden, d.h. eine andere 
REaktion erfolgen. So kann etwa eine erste PAE gestoppt und 
eien zweite PAE umkonf iguriert ewrden. Senden mehrere PAEs 
einen Trigger, kann das den Trigger generierende Ereignis in 
jeder PAE ein anderes sein. 

Es sei erwShnt, dafi auch bei Bussystemene usw. eine Wave- 
Rekonfiguration und/oder eine partielle Rekonfiguration 
erfolgen kann. Eine partielle REkonfigurationeines Busses kann 
beispielsweise bei der nur abschnittsweisne REkonf iguration 
erfolgen, 

3.2 Systems tatus und Progxamrnzeiger 

Ein System ist je nach Implementierung ein Baustein oder eine 
miteinander gekoppelte Gruppe von Bausteinen. Zur Verwaltung 
eines Arrays aus PAEs - das bei einem System 

bausteintibergreiferid ausgestaltet ist - ist es nicht sinnvoll 
den Zustand oder Programmzeiger jeder PAE zu kennen. Zum • 
naheren Verstandnis wird zwischen mehreren Fallen 
unterschieden : 
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• ' PAEs'' ails Baueieriiente ohrie Prozessbreigenschaft . Derartige 
PAEs benOtigen" keinen eiigerien Proigrairimzeiger . Der 
Zustand einer einzelnen PAE ..ist meist bedeutungslos, da 
hur bestimmte PAEs einen nutzbaren Zustand besitzen (vgl. 
PACT01 : Dort ist der Zustand, der durch eine PAE 
reprasentiert ist, kein Programmcounter, sondern ein 
Datencounter) . Der Zustand einer Gruppe von PAEs wird 
durch die Verkniipfung der Zustande der einzelnen 
relevanten PAEs bestimmt. Mit anderen Worten 
reprasentiert die Information innerhalb des Netzwerkes 
der Trigger den Zustand. 

• PAEs als Prozessoren . Diese PAEs besitzen einen eigenen 
internen Programmzeiger und Status. Bevorzugt wird 
lediglich die Information einer PAE, die ftir die anderen 
PAEs oder eine andere PAE relevant ist, durch Trigger 
ausgetauscht . 

Die Interaktion der PAEs untereinander ergibt einen 
gemeinsamen Status, der ausgewertet werden kann, etwa in 
der CT, urn zu bestimmen, wie eine Neukonfiguratiuon 
erfolgen soil. Dabei kann gegebenerifalls berdcksichtigt 
werden, wie jeweils das evtl. konf igurierbare Netzwerk der 
zur Triggeriibertragung verwendeten Leitungen bzw. Busse 
mbmentari konfiguriert ist. 
Das Array aus PAEs (PA) besitzt somit einen globalen Zustand. 
Die wesentliche Information wird durch bestimmte Trigger an 
die CT gefuhrt, die anhand derer die Programmausfiihrung durch 
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Reconfiguration steueft. Besonders bemerkeriswert 1st, dafi 
damit kein Programmzahler mehr existiert. 

4 . (Re) Konf iguration 

VPU Bausteine werden aufgrund von Ereignissen konfiguriert 
oder umkonfiguriert. Diese Ereignisse k5nnen durch Trigger 
(CONFIG) reprasentiert werden, die an eine CT tibertragen 
werden. Ein eingehender Trigger referenziert eine bestimmte 
Konfiguration (SubConf) ftir bestimmte PAEs. Die referenzierte 
SubConf wird an eine oder mehrere PAEs gesendet. 
Die Referenzierung geschieht mittels eines Lookup-Systems nach 
dem Stand der Technik oder einer beliebigen anderen 
Adressumsetzung bzw. -generierung. Beispielsweise konnte 
folgendermaBen anhand der Nummer eines eingehenden Triggers 
die Adresse der auszufUhrenden Konfiguration (SubConf) 
berechnet werden, wenn die SubConf eine feste LSnge besitzen: 
Offset + (Trigger nummer * SubConf LSnge) . 

VPU Bausteine kennen drei Konfigurationsmodi: 

a) Globale Konfiguration, die gesamte VPU wird umkonfiguriert. 
Die gesamte VPU mufi sich in einem konf igurierbaren Zustand 
befinden, d.h. muB unkonfiguriert sein. 

b) Lodale Konfiguration, ein Teil der VPU wird umkonfiguriert. 
Der lokale Teil der VPU, der umkonfiguriert werden soil, muB 
sich in einem konf igurierbaren Zustand befinden, d.h. muB 
unkonfiguriert sein. 
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c) Dif f erentieile Konfiguration, eirie bestehende Konfiguration 
wird modif iziert . Die PAEs, die limkonf iguriert werden sollieri, 
mtissen sich in einem .konf igurierten Zustand befinden, d.h. muB 
konf iguriert sein. 

Eine Konfiguration besteht aus einer Menge von 
Konf igurationswSr tern (KWs) . Jede Konfiguration kann per se 
ref erenziert werden, beispielsweise durch eine Ref erenznummer 
(ID), die bedarfsweise eindeutig sein kann. 

Im folgenden soli eine durch eine ID gekennzeichnete Menge von 
KWs als SubConfiguration (SubConf) bezeichnet werden. In einer 
VPU. konnen mehrere sowohl unterschiedliche, als auch 
gleichartige SubConf konfiguriert sein, die gleichzeitig auf 
unterschiedlichen PAEs ablaufen. 

Eine PAE kann ein oder mehrere Konf igurationsregister 
besitzten, wobei je ein Konf igurationswort (KW) ein 
Konf igurationsregister beschreibt. Einem KW ist grundsatzlich 
die Adresse der zu konf igurierenden PAE zugeordnet. Ebenso 
sind einem KW gewShnlicherweise Inf ormationen, die die Art der 
Konfiguration angeben zugeordnet. Diese Inf ormationen ktfnnen 
technisch durch Flags oder eine Kodierung realisiert werden. 
Flags werden nachfolgend detailliert beschrieben. 

4.1 ModulID 
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FUr die raeisten Opefatibrieri ist es ausreicherid, dafi die CT die 
Zuordnung eines Konfigurationswortes und der betreffenden PAE ". 
zu einer SubConf kennt. Ftir komplexere Operatipnen im 
Processing Array ist es jedoch sinnvoll, in jeder PAE die ID 
der ihr zugeordneten SubConf zu speichern. 

Eine innerhalb des PA gespeicherte ID wird zur Unterscheidung 
der ID innerhalb der CTs im Folgenden ModulID genannt. 
Es gibt mehrere Grtinde fur die EinfUhrung der ModulID, einige 
sollen beschrieben werden: 

• Eine PAE darf nur auf einen Bus auf geschaltet werden, der 
auch zu der entsprechenden SubConf gehSrt. Wird eine PAE 
auf einen falschen (fremden) Bus aufgeschaltet, kann dies 
zur Verarbeitung falscher Daten fiihren. GrundsStzlich 
kann dieses Problem dadurch gelost werden, daB Busse 
zeitlich vor PAEs konfiguriert werden, was zu einer 
starren Reihenfolge der KW innerhalb einer SubConf filhrt. 
Durch die EinfUhrung von ModulID kann dies umgangen 
werden, indem eine PAE ihre gespeicherte ModulID mit der 
der ihr zugeordneten Busse vergleicht und sich erst dann 
auf einen Bus aufschaltet, wenn dessen ModulID mit der 
der PAE tibereinstimmt. Solange die beiden ModulIDs 
unterschiedlich sind, wird die Busverbindung nicht 
aufgebaut. Alternativ. ist eine Bussharingyerwaltung , 
realisierbar, vgl. PAct 07. 

• PAEs konnen durch ein Signal LocalReset in den Zustand 
„unkonfiguriert w versetzt werden. Local Reset get von 
einer PAE im Array aus und nicht von einer CT; daher 
„lokal" . 
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Dazumufl das Signal zwischen alien PAEs einer SubConf . 
yerbunden werden. Problematisch wird dieses Vorgehen, 
wenn eine SubConf gelSscht werden soil, die noch.nicht 
vollstandig konfiguriert wurde und daher nicht alle PAEs 
an LocalReset angeschlossen sind. Mittels der ModulID 
kann die CT einen Befehl an alle PAEs broadcasten. Die 
PAEs mit der entsprechenden ModulID wechseln ihren 
Zustand auf „unkonf iguriert" 

• In manchen Applikationen darf eine SubConf erst zu einem 
bestimmten Zeitpunkt gestartet werden, kann aber bereits 
vorher konfiguriert werden. Mittels der ModulID kann die 
CT einen Befehl an alle PAEs broadcasten. Die PAEs mit 
der entsprechenden ModulID starten daraufhin die 
Datenverarbeitung . 

Grundsatzlich kann die ModulID auch mit der in der CT 
gespeicherten ID iibereinstimmen. 

Die ModulID wird in ein Konf igurationsregister in der 
jeweiligen PAE geschrieben. Da IDs fiir gewShnliche eine 
erhebliche Breite von zumeist mehr als 10 Bits aufweisen, ist 
das Bereitstellen eines der art groBen Registers in jeder PAE 
ineffizieht. 

Es wird daher vorgeschlagen die ModulID der jeweiligen SubConf 
von der ID abzuleiten, dafc sie eine geringe Breite besitzt und 
eindeutig ist. Da die Menge aller Module innerhalb eines PA 
typisch vergleichsweise gering ist f ist eine ModulID Breite 
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von wenigeri Bits ( z . B . 4-5 Bits) ausf eichend . Moduli D unci ID 
sind bijektiv aufeinander abbildbar. Mit anderen Wortieri 
identifiziert die ModulID ein konfiguriertes Modul eindeutig . 
innerhalb eines Arrays zu einem bestimmten Zeitpunkt. Die 
ModulID wird vor der Konf iguration einer SubConf so vergeben, 
dafi die SubConf zur Ausfahrungszeit eindeutig im PA 
identifizierbar ist. Eine SubConf kann mehrfach gleichzeitig 
in dais PA konfiguriert sein (vgl. Makros, nachfolgerid 
beschrieben) . Zur eindeutigen Zuprdnung wird filr jede 
konfigurierte SubConf eine eindeutige ModulID vergeben. 

Die Obersetzung einer ID auf eine ModulID kann Ober Lookup- 
Tabellen oder Listen ablaufen. Da hierzu zahlreiche 
Abbildungsverfahren bekannt sind f soli nur eine M5glichkeit 
genauer erlautert werden: 

Eine Liste deren Lange 2 ModulID betragt enthalt die Menge aller 
aktuell im Array konf igurierten IDs 7 wobei je einem 
Listeneintrag eine ID zugeordnet ist. Der Eintrag „0" 
kennzeichnet eine unbenutzt ModulID. Wird eine neue ID 
konfiguriert, mufi diese einem freien Listeneintrag zugeordnet 
werden, dessen Adresse die entsprechende ModulID ergibt. Die 
ID wird in an der Adresse ModulID in die Liste eingetragen. 
Beim L5schen einer ID wird der entsprechende Listeneintrag 
wieder auf „0" gesetzt. 

4.2 PAE Zustande 
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Jedes KW 1st mit zusatzlichen Flags versehen, die d6n Zustand 
eirier PAE prtifen und steuern: 

CHECK: .Eine unkonfigurierte PAE wird alloziert und. . 
konfiguriert . Soferri der Zustand der PAE „unkbnfiguriert" ist, 
wird die PAE mit dem KW konfiguriert. Der Vorgang wird mit ACK 
quittiert. 

Bef indet sich die PAE im Zustand „konf iguriert? oder 
„allocated"j wird das KW nicht akzeptiert. Die ZurUckweisung 
wird mit RE J quittiert. 

Nach Eintreffen von CHECK geht eine PAE in den Zustand 
„allocated" tiber.. Jeder weitere CHECK wird .zurtfckgewiesen, die 
Datenverarbeitung wird jedoch nicht gestartet. 
DIFFERENTIAL: Die Konf igurationsregister einer bereits 
konfigurierten PAE werden modifiziert . Sbfern der Zustand der 
PAE „konfiguriert u oder „allocated^ ist, wird die PAE mit dem 
KW modifiziert. Der Vorgang wird mit ACK quittiert. 
Bef indet sich die PAE im Zustand „unkonfiguriert", wird das KW 
nicht akzeptiert , es wird durch RE J (Reject) quittiert. 
GO: Die Datenverarbeitung wird gestartet. GO kann einzeln oder 
zusammen mit CHECK oder DIFFERENTIAL gesendet werden. 
WAVE: Eine Konf iguration wird mit der Datenverarbeitung 
verknCpft. Sobald der Trigger WAVE eihtrifft wird die mit dem 
Flag WAVE gekennzeichnete Konf iguration in die PAE geladen. 
Wird vor Eintreffen der Triggers WAVE konfiguriert, bleiben 
die mit dem WAVE-Flag gekennzeichneten KW bis zum Eintreffen 
des Triggers gespeichert und werden erst mit dem Trigger 
aktiv. Sofern der Trigger WAVE vor den KW mit dem Flag WAVE 
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eintrifft, wird die batenverarbeitung bis ziim Eintrefifen der 
KW. ahgehalteri. 

Mindestens CHECK oder DIFFERENTIAL raufl je ttbertragenem KW 
gesetzt sein. CHECK und DIFFERENTIAL sind jedoch nicht 
gleichzeitig erlaubt. CHECK und GO/ bzw. DIFFERENTIAL und GO 
sind zuiassig und star ten die Datenverarbeitung. 

Zusatzlich ist ein Flag implementiert, das keinem KW 
zugeordnet ist und von der CT explizit gesetzt wird: 
LOCK: Eine PAE kann nicht beliebig in den Zustand „not 
configured" wechseln. ware dies der Fall, kSnnte 
beispielsweise die Zelle noch konfiguriert und mit der 
Verarbeitung von Daten befafit sein, wShrend versucht wird, 
eine erste Konf iguration aus dem FILMO-Speicher in die Zelle 
zu schreiben; dann beendet die Zelle wShrend des weiteren 
FILMO-Durchlaufes ihre Tatigkeit. Prinzipiell, d*h. ohne 
weitere MAfinahmen, konnte daher eine im.FILMO nachfolgende 
gespeicherte zweite Konf iguration, die eigentlich erst nach 
der ersten ausgeftihrt ewrden darf, diese ZElle belegen. Dies 
kann dann zu DEADLOCK-Situationne fUhren. Indem der Wechsel 
der Konfigurierbarkeit dieser Zelle durch den BEfehl LOCK 
zeitweilig beschrankt wird, kann ein solcher DEadlock 
vermieden werden, indme die Zelle daran gehindert wird, zu 
einem ungewollten Zeitpunkt konfigurierbar zu werden. Dieses 
Locken der Zelle gegen Umkonf iguration kann insbsondere 
entweder erfolgen, wenn der FILMO duchlaufen wird, und zwar 



25 



WO 02/13000 



PCT/EP01/06703 



unabhagig davon, ob es sich um eine Zeile handeit, auf die zum 
Zwecke.der Umkonfiguration tatsachlich zugegriffen wird. 
Alternativ kann das Locken der Zelle gegen Umkonf igurierung 
erfolgen, indem etwa beim ersten, erfolglosen Zugriff auf die 
Zelle duch eine im Filmo liegende erste Konfiguration der 
Zelle verboten wird, sich eine bestimmte Phase lang 
umzukonf igurieren, was das Einkonf igurieren der zweiten 
Konfiguration nur bei jenene Zellen verhindert, auf die mit 
einer frtihreren Konfiguration zugegriffen werden soil. 

Nach dera FILMO- Prinzip ist ein Wechsel also nur wahrend 
bestiinmter Zustande im FILMO zulassig. Durch LOCK wie 
diskutiert steuert die FILMO Zustandsmaschine den Obergang in 
den Zustand „not configured". 

Je nach Impleraentierung tibermittelt die PAE ihren aktuellen 
Zustand an eine iibergeordnete Steuereinheit (z.B. die 
zugeordnete CT), oder speichert diesen lokal. 

Oberganqstabellen 

Die einfachste Realisierung einer Zustandsmaschine zur 
Einhaltung des FILMO Protokolles ist ohne die Verwendung von 
WAVE und CHECK/ DIFFERENTIAL moglich. Dabei ist lediglich das 
GO-Flag implement iert, eine Konfiguration besteht aus KW f die 
zusamraen mit GO Obertragen werden. Folgende Zustande kOnnen 
implementiert sein: 

not configured: Die PAE verhait sich vollkommen neutral , d.h. 

/ 

nimmt keine Daten oder Trigger an und sendet auch keine Daten 
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oder Trigger. Eine Kdrif iguration wird erwartet. Dif ferentielle 
Korifiguratidrien, falls ''li^ic^enilert/'mrd^n- zurQckgewiesenl 
configured: Die PAE 1st konfiguriert und verarbeitet Daten und 
Trigger. Weitere Konfigurationen werden zurttckgewiesen, 
differentielle Konf igurationen, falls iraplementiert, werden 
akzeptiert. 

wait for lock: Die PAE erhielt eine Aufforderung zur 
Re konf iguration (z.B. durch Local Reset oder setzen eines Bits 
in einem Konf igurationsregister) . Die Datenverarbeitung ist 
eingestellt, die PAE erwartet die Aufhebung des LOCK, um den 
Zustand nach „not configured" wechseln zu kGnnen. 



aktueller PAE Zustand 


Ereignis 


nachster Zustand 


not configured 


GO-Flag 


Configured 


configured 


Local 
Reset- 
Trigger 


wait for lock 


wait for lock 


LOCK-Flag 


not configured 



Eine vervollstSndigte Zustandsmaschine gemSfi dem beschriebenen 
Verfahren ermGglicht die Konf iguration einer PAE, die mehrere 
KWs benOtigt. Dies 1st z.B. dann der Fall, wenn eine 
Konf iguration tibertragen werden soil, die auf mehrere 
Konstante Bezug nimmt und diese Konstanten nach bzw. mit der 
eigentlichen Einkonfigurierung auch in die PAE geschrieben 
ewrden sollen. Dazu ist ein weiterer Zustand erforderlich. 

allocated: Die PAE wurde durch CHECK geprilft und war zur 

Konf iguration bereit. Im Zustand allocated verarbeitet die PAE 
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noch keiiie Daten. Wei t ere mit DIFFERENTIAL gekennzeichn^te KW 
werden akzeptiert. Mit CHECK gekennzeichnete KW werden 
zurtickgewiesen. 

Nachfolgend ist die entsprechende Obergangstabelle abgebildet, 
WAVE ist noch nicht implementiert : 



aktueller PAE Zustand 


Ereignis 


n&chster Zustand 


not configured 


CHECK- 
Flag 


allocated 


not configured 


GO-Flag 


configured 


allocated 


GO-Flag 


configured 


configured 


Local 
Reset- 
Trigger 


wait for lock 


wait for lock 


LOCK-Flag 


not configured 



4.2.1 Implementierung von GO 

GO wird 

entweder sofort bei der Konf iguration einer PAE zusammen mit 
dem KW gesetzt, um die Datenverarbeitung sofort zu starten, 

oder nach Abschlufi der gesamten SubConf an die jeweiligen PAEs 
gesendet. 

Das Flag GO kann unterschiedlich implementiert sein: 
a) Register 

Jede PAE besitzt ein Register, das zum Start der Verarbeitung 
gesetzt wird. Die technische Realisierung ist vergleichsweise 
einfach, jedoch ist fiir jede PAE ein Konf igurationszyklus 
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erfbrderlich. GO wird als Flag gemkfi' der vorherigen 
Beschreibung zusammen mit dem KW. Gbertragenl . 
Fiir ..den Fall, daft die Reihenfolge, in der PAEs verschiedener 
PACs, die zu einer EnhSubConf gehioren, konfiguriert werden, 
nicht unerheblich ist, wird zur Sicherstellung der Einhaltung 
dieser zeitlichen Abhangigkeit ein weiteres Verfahren 
vorgeschlagen. Da bei mehreren PACs definitionsgemSB auch 
mehrere CTs existieren, verstclndigen sich diese unterieinander, 
iam die Information auszutauschen f ob bisher alle PAEs, die vor 
den in jeder PAC nSchsten konfiguriert sein miissen, bereits 
ihr GO aus derselben Konf iguration akzeptiert haben. 

Eine M^glichkeit, die zeitlichen AbhSngigkeiten aufzulosen und 
das Senden von nicht erlaubten GOs zu verhindern, ist, die KW 
so umzuordnen, daB eine korrekte Reihenfolge durch die Abfolge 
ihrer Konf iguration durch den FILMO sichergestellt wird. Der 
FILMO merkt sich dann, evtl. durch ein Flag, fur jede 
{Configuration, ob bisher alle GOs der aktuellen Konf iguration 
akzeptiert wurden. 1st dies nicht der Fall, werden weitere GOs 
dieser Konf iguration nicht mehr geschickt. Der Initialzustand 
bei jeder neuen Konf iguration ist dabei so, als wenn bisher 
alle GOs akzeptiert wurden. 

Urn die Wahrscheinlichkeit, daB einige PAEs bei der 
Konfiguration bereits nicht mehr konfiguriert sind, zu 
erh6hen, kann man die KW einer zumindest teilweise 
sequentiellen Konfiguration so umsortieren,. dafi KW der 
betreffenden PAEs zeitlich spater konfiguriert werden. Ebenso 
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kariri many wenh dies erforderlich ist; b^stiinmte PAEs frtthef 
aktivieren, indem man KW der betreffehden Kohfiguration so 
umordnet, dafi die betreffenden PAEs zeitlich frtther 
konfiguriert werden. Diese Verfahren sind insbesondere 
anwendbar, wenn die Reihenfolge der KW nicht durch zeitliche 
Abhangigkeiten, welche auch nach der Dmsortierung eingehalten 
werden mtissen, bereits vollstandig festgelegt ist. 

b) Verdrahtung mittels Leitunq 

Ebenso wie . zur Verwendung des LocalReset Signal werden PAEs zu 
Gruppen zusammengef aBt, die gemeinsam gestartet werden sollen. 
Innerhalb dieser Gruppe werden alle PAEs mit einer Leitung zur 
Verteilung von GO verbunden. Sofern eine Gruppe gestartet 
werden soli, wird einer ersten PAE GO signalisiert, was durch 
Senden eines Signals oder Setzen eines Registers (siehe a) ) 
dieser ersten PAE realisiert wird. Von dieser PAE aus wird GO 
an alle anderen PAE3 weitergeleitet. Zum Starten ist ein 
Konfigurationszyklus erforderlich. Fttr die Weiterleitung wird 
zur Oberbrttckung grafierer Distanzen eine Latenzzeit benStigt. 

c) Broadcast 

Eine Abwandlung von a) und b) bietet eine hohe Perfomance (nur 
ein Konfigurationszyklus) bei vergleichsweise greringem 
Aufwand. 

Dazu erhalten alle Module eine ModulID, die gewohnlicherweise 
ungleich der SubConfID ist. 

Dabei ist die Grofie der ModulID m6glichst klein zu halten, 
nach MSglichkeit sollte eine Breite von einigen wenigen Bits 
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(3-5) ausreicheri. Die Verwenduhcj von ModulID wird nachfolgende 
ausfiihrlich beschrieberi. 

In jede PAE wird wShrend der Konfiguration die entsprechende 
ModulID geschrieben. 

GO wird danach mittels eines Broadcasts gestartet, indem die 
ModulID zusammen mit dem GO-Befehl in das Array gesendet wird. 
Der Befehl wird von alien PAEs empfangen, jedqch nur von den 
PAE s mit der passenden ModulID ausgeftihrt.' 

4.2.2 Sichem des PAE - Zu s tande s 

Der Zustand einer PAE darf sich hicht innerhalb einer 
Konfiguration oder eines FILMO Durchlaufes von „konfiguriert" 
auf „unkonfiguriert" andern. Beispiel: Zwei verschiedene 
SubConf (A, D) teilen dieselben Ressourcen, insbesondere eine 
PAE X. Im FILMO liegt SubConf A zeitlich vor SubConf D. Somit 
mufi SubConf A die Resourcen vor SubConf D belegen. PAE X ist 
zum Konfigurationszeitpunkt von SubConf A „konfiguriert", 
wechselt vor der Konfiguration von SubConf D aber den Zustand 
auf „unkonfiguriert". Daraus entsteht eine Deadlock Situation, 
da nunmehr SubConf A PAE X nicht mehr konf igurieren kann, 
SubConf D aber die restlichen Resourcen, die bereits von 
SubConf A belegt sind nicht mehr konf igurieren kann. Weder 
SubConf A noch SubConf D konnen ausgeftthrt werden. 
Durch LOCK wird wie erwahnt sichergestellt, daB sich der 
Zustand einer PAE wShrend eines FILMO Durchlaufes nicht 
unerlaubt Sndert. Dabei ist es ftir das FILMO-Prinzip 
unbedeutend, wie die Zustandssicherung durchgeftthrt wird, 
dennoch sollen mehrere MSglichkeiten diskutiert werden: 
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LOCK Gruridpr iriz ip 

Vor Beginn der erst en Konfiguration und bei j edem neueh 
Durchlauf des. FILMOs wird der Status der PAEs. gesichert bzw. 
eingerastet. Nach Beendigung jedes Durchlauf es wird der Status 
wieder freigegeben. Bestimmte Statusanderungen werden also nur 
einmal pro Durchlauf erlaubt. 
Expliziter LOCK 

Das Lock-Signal wird erst nach dem ersteil RE J aus dem PA seit 
Beginn eines FILMO- Durchlauf s gesetzt. Dies ist mSglich, da 
zuvor alle PAEs konf iguriert werden kohnten und damit bereits 
im Zustand „unkonf iguriert" waren. Nur eine PAE, die ein REJ 
generiert, k6nnte wahrend des weiteren FILMO-Durchlaufes ihren 
Zustand von ^configured" auf „not configured" Sndern. Erst ab 
diesem Zeitpunkt konnte ein Deadlock auftreten, namlich wenn 
ein erstes KW einen REJ erhielt und ein zeitlich spateres 
konf iguriert wird. Durch das sofortige Setzen von LOCK nach 
einem REJ wird der Obergang von „configured" nach „not 
configured" aber sofort verhindert. Der wesentliche Vorteil 
dieses Verfahrens ist, dafi wShrend der ersten Durchlauf phase 
PAEs ihre Zustande noch verandern kGnnen, das heifct 
insbesondere f in den Zustand „unkonfiguriert" wechseln. dttrfen. 
Wechselt eine PAE also wahrend eines Durchlauf s vor einem 
fehlgeschlagenen Konf igurationsversuch von ^configured" nach 
7/ not configured" kann diese in derselben Konfigurationsphase 
konf iguriert werden. 
Impliziter LOCK 

Eine noch effizientere Erweiterung des expliziten LOCKs ist 
die implizite Handhabung von LOCK innerhalb einer PAE. 
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Generell sind nur PAiEs von der Bedingung der Statussicherung 
betroffen, die eirie Konf Iguratidn ^ ^riickgewiesen haberi (REJ) . 
Daher ist es hinreichend wahrend eines FILMO^Durchlauf es den 
Status nur innerhalb der PAEs zu sichern, die ein REJ 
generierten. Alle anderen PAEs bleiben davon unbertihrt. LOCK 
wird dabei nicht mehr von einer tlbergeordneten Instanz (CT) 
generiert • Vielmehr wird nach einem FILMO Durchlauf durch ein 
Signal FREE die Statussicherung in den betrbffenden PAEs : 
wieder aufgehoben, FREE kann direkt nach einem FILMO-Durchlauf 
ail alle PAEs gebroadcastet werden und kann auch gepipelinet 
durch das Array geleitet werden. 

Erweiterte Obergangstabellen ftir implizites LOCK: 
Eine von einer PAE generierte Zuriickweisung (REJ) wird lokal 
in jeder PAE gespeichert (REJD = rejected) . Erst bei Rtlckkehr 
nach „not configured" wird die Information geldscht. 



aktueller PAE Zustand 


Ereignis 


nachster Zustand 


not configured 


CHECK-Flag 


Allocated 


not configured 


GO-Flag 


Configured 


allocated 


GO-Flag 


Configured 


configured 


Local Reset- 
Trigger & 
Zuriickweisung 
(REJD) 


wait for free 
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configured 


Local Reset- 
Trigger & 
keine 

Zuriickweisung 
(not REJD) 


not configured 


wait for free 


FREE- Flag 


not configured 



Die Obergangstabellen sind beispielhaf t . Eine reale 
Implementierung ist von der jeweiligen Ausgestaltung abhSngig. 



4.2.3 Koixf iquration einer PAE 

In diesem Abschnitt soli der Konf igurationsablauf aus Sicht 
der CT nochmals dargestellt werden. Als PAE gelten dabei auch 
Teile einer PAE, wenn diese unabhcingig voneinander die zuvor 
beschroiebenen Zustande verwalten. 

Sofern eine PAE neu konfiguriert wird, muB das erste KW das 
Flag CHECK setzen, urn den Status der PAE zu priifen. Eine 
Konf iguration fUr eine PAE ist derart aufgebaut, dafi 
entweder nur ein KW konfiguriert wird 



CHECK 


DIFFERENTIAL 


GO 


KW 


X 






KWO 



Oder mehrere KW konfiguriert werden, wobei beim Erst en CHECK 
gesetzt ist und bei alien Weiteren DIFFERENTIAL. 



CHECK 


DIFFERENTIAL 


GO 


KW 


X 






KWO 




X 




KW1 




X 




KW2 




X 


* 


KWn 
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(X) ges&tzi, (-) nicht gesetzt, GO 1st jeweils optional '(*)".' 

Sofern. CHECK zuriickgewiesen. wird (RE J) wird kein nachfolgendes 
KW mit DIFFERENTIAL Flag an die PAE gesendet. Nach 
akzeptiertem CHECK (ACK) , werden alle weiteren CHECKS bis zur 
Rtickkehr auf den Status „not configured" zuriickgewiesen, die 
PAE ist fUr die akzeptierte SubConf alloziiert. Innerhalb 
dieser SubConf werderi die nachsten KW ausschlieBlich mit 
DIFFERENTIAL konf iguriert . Dies ist zulassig, da durch CHECK 
bekannt ist, daB diese SubConf Zugriff srechte auf die PAE 
besitzt . 

4.2.4 Riicksetzen in den Status „not configured" 

Durch einen besonders ausgestalteten Trigger (LocalReset) wird 
ein Signal propagiert, das das lokale Zuriicksetzen des 
Zustandes „conf igured" nach „not configured" in den 
empfangenden PAEs ausltfst, spates tens nach einem empfangenen 
LOCK oder FREE. Das Zurttcksetzen kann zusStzlich noch durch 
andere Quellen ausgelftst werden, beispielsweise durch ein 
Konf igurationsregister . 

LocalReset kann von der Quelle, die das Signal generiert tiber 
alle bestehenden konfigurierbaren Busverbindungen, d.h. 
sSicttliche Triggerbusse und samtliche Datenbusse, an jede tiber 
die Busse angeschlossenen PAEs weitergeleitet werden. 
Grundsatzlich leitet dabei z.B. jede LocalReset empfangende 
PAE das Signal wiederum tiber alle angeschlossenen Busse 
weiter . 
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Um jedoch eine Weiterleitung von LocalReset tiber die Grenze 
einer lokalen Gruppe hihaus zu vef hindern, ist unabhSngig f tir 
jede Zelle konfigurierbar, ob und tiber welche angeschlossenen 
Busse das LocalReset weitergeleitet werden soil. 

4.2.4.1 Loschen nicht vollstanriig konf igurierter SubConf 

In einigen Fallen kann es vorkommen, daB mit der Konf iguration 
einer SubConf begonnen wird und wahrend der Konf iguration 
festgestellt wird, daB die SubConf entweder nicht (mehr) pder 
nicht vollst£ndig ben6tigt wird. LocalReset andert unter 
UmstSnden nicht den Zustand aller PAEs auf „unkonf iguriert", 
da der Bus noch nicht komplett aufgebaut wurde. 
Zwei MSglichkeiten werden erf indungsgemSB zur LGsung 
vorgeschlagen. Bei beiden Verfahren sendet die PAE, die das 
LocalReset generiert hatte, einen Trigger an die CT. Die CT 
informiert daraufhin die PAEs wie folgt: 

4.2.4.2 Bei Verwendung von ModulID 

Sofern eine MCglichkeit zur Speicherung der ModulID innerhalb 
jeder PAE vorgesehen ist, kann mittels eines einfachen 
Broadcasts/ bei dem die Identifikation iaitgesendet wird, jede 
PAE mit dieser bestimraten Identifikation aufgefordert werden, 
in den Zustand „not configured" zu gehen. 

4.2.4.3 Bei Verwendung des GO-Signales 

Sofern eine GO-Leitung in exakt der Reihenfolge verdrahtet 
wird, wie PAEs konfiguriert werden, ist es moglich der GO- 
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Leitung eine Reset-Leitung zuzuordnen, die samtliche PAEs in 
den Zustand „not contiguried" setzt. . . 

4.2.4.4 Explizites Reset durch Konf ignrationsreglster 

In jeder PAE wird ein Bit oder ein Code innerhalb der 
Konf igurations register definiert, wobei durch Setzen dieses 
Bits oder Codes durch die CT die PAE in den Zustand „not 
configured" zuriicJcgesetzt wird. 

4.3 Hal ten der Paten in den PAEs 

Besohders vorteilhagft ist bei Bausteineri der 
erfindungsgemaBen Gattung ist, wenn Daten und Zustande einer 
PAE Ober eine Rekonf iguration hinweg gehalten werden konnen. 
Mit anderen Worten, ist es m6glich innerhalb einer PAE 
gespeicherte Daten trotz Rekonf iguration zu erhalten. Durch 
entsprechende Angaben in den KW wird dazu filr jedes relevante 
Register definiert ob es durch die Rekonf iguration 
zurtickgesetzt wird. 
Beispiel: 

Ist ein Bit innerhalb eines KW zum Beispiel logisch 0 wird der 
aktuelle Registerwert des zugeordheten Daten- oder 
Zustandsregisters beibehalten, eine logische 1 setzt den Wert 
des Registers zuriick^ Ein entsprechendes KW k5nnte 
folgendermassen strukturiert sein: 



Eingangsregister 


Ausgangsregister 


Zustandsflags 


A 


B 


C 


H 


L 


equal/ 
zero 


overflow 



Dadurch ist bei jeder Rekonf iguration der Datenerhalt wahlbar. 
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4.4 Setzen von Paten in den PAEs 

Weiterhin ist.es moglich. Daten bei Rekonf iguration von der CT 
in die Register der PAEs zu schreiben. Dabei sind die 
relevanten Register durch KWs adressierbar . Ein besonderes Bit 
zeigt an, ob die Daten als Konstante oder als Datenwort 
behandelt werden . 

• Eine Konstante bleibt bestehen, bis sie neu gesetzt wird. 

• Ein Datenwort ist f iir genau eine bestimmte Anzahl von 
Verrechnungen, z.B. genau eine Verrechnung giiltig. Nach 
Verarbeitung des Datenwortes existiert das von der CT in- 
das Register geschriebene Datenwort nicht mehr. 

5 . Erweitemngen 

Das Busprotokoll kann derart erweitert werden, daB die KWs 
und ACK/REJ Signale auch tlber Register gepipelinet werden 
k5nnen . 

Dies ist besonders vorteilhaft und wird ftir sich Oder in 
Verbindung mit anderem als patentfahig angesehen. 

In jedem Takt soli ein KW oder mehrere KWs gesendet werden 
k6nnen. Das FILMO-Prinzip soli eingehalten werden. Das 
Grundprinzip sieht vor, eine Zuordnung zu einem in das PA 
geschriebene KW derart aufzubauen, dafi die zeitlich verzGgerte 
Quittierung nachtrSglich dem KW zugeordnet wird. Von der 
Quittierung abhangige KW werden derart umsortiert, daB sie 
erst nach Eintreffen der Quittierung verarbeitet werden. 
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Die nachfolgerid beschriebehen alternativen Verfahren erfiillen 
die Ahf orderurigen, wobei.. die Verfahren unterschiedliche . 
Vorteile aufweisen: 

5.1 Lookup-Tabellen (STATELUT) 

Jede PAE sendet ihren Status an eine Lookup Tabelle (STATELUT) 
die lokal in der CT implementiert 1st. Die CT prtift beirn 
Versenden eines KW den Zustand der adressierten PAE durch 
einen Lookup in der STATELUT. Die Quittierung (ACK/REJ) wird 
von der STATELUT generiert. 

Im Detail funktioniert das Verfahren wie folgt: 

In einer CT wird der Zustand jeder einzelnen PAE in einem 
Speicher oder Regis tersatz verwaltet. Fiir jede PAE existiert 
ein Eintrag, der anzeigt in welchem Modus („konf iguriert", 
„unkonfiguriert >% ) sich die PAE befindet. Anhand des Eintrages 
prttft die CT f ob die PAE umkonfiguriert werden kann. Der 
Zustand wird von der CT intern, also ohne Nachfrage bei den 
PAEs geprtift. Jede PAE sendet ihren Status je nach 
Implementierung selbstandig oder nach Aufforderung an die CT- 
interne STATELUT. Bei gesetztem LOCK bzw. fehlendem FREE 
werden keine Statusanderungen voh den PAEs an die STATELUT 
gesendet, bzw. von der STATELUT ttbernommen. 

Durch einen einfachen Mechanismus wird der Zustand der PAEs 
uberwacht, wobei die bereits beschriebenen Mechanismen der 
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Zustandssteuerung und die bekahnten Zustande realisiert 

.werden:; ... ' ■' * ■ '/■;'. 

Setzen des Zustands „konfiguriert" 

Beira Schreiben einer mit dera Flag CHECK versehenen KW erfolgt 
eine Priifung der adressierten PAE in der STATELUT. 

• Soferh die PAE in einera umkonfigurierbaren Status ist, 
wird die PAE als „allocated" in der STATELUT vermerkt. 

• Sobald die PAE gestartet wird (GO), wird die PAE als 
configured" eingetragen. 

RQcksetzen des Zustandes „konf iquriert" auf „unkonf iguriert" 
Mehrere Methoden k6nnen je nach Applikation und 
Implementierung verwendet werden: 

a) Jede PAE sendet ein Statussignal an die Tabelle, wenn sich 
ihr Zustand von "konf iguriert" auf "unkonfiguriert" andert. 
Dieses Statussignal kann gepipelined gesendet werden. 

b) Ein Statussignal (LocalReset) wird fttr eine Gruppe von PAEs 
gesendet, das anzeigt, dafi sich der Zustand fiir die gesamte 
Gruppe von "konfiguriert" auf "unkonfiguriert" geSndert hat. 
Ober eine Liste werden samtliche PAEs die zur Gruppe gehSren 
ausgewahlt und der ?ustand ftir jede einzelne PAE in der 
Tabelle geSndert. Wesentlich ist, daft das Statussignal von 
der let z ten per LocalReset entferntem PAE einer Gruppe an 
die CT gesendet wird. Ansonsten kann es zu Inkonsistenzen 
zwischen der STATELUT und dem tatsachlichen Zustand der PAEs 
kommen, indem die STATELUT eine PAE als „unkonf iguriert" 
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ausweist, die sich tatsachlich jedoch nbch im Zustand 
„kpnfiguriert u befindeit. 

c) Nach Eintreffen eines LOCK-Signals, das vorzugsweise 
gepipelinet wird, sendet jede PAE, deren Status sich seit 
dem letzten Eintreffen von LOCK geandert hat, ihren Status 
an die STATELUT. LOCK erhait dabei eher die Semantik 
„ TRANSFER STATUS". Da PAEs ihren Status jedoch nur nach 
dieser Aufforderung tibertragen und die StatusSnderung 
ansonsten geLOCKed 1st, bleibt das Verfahren bis auf die 
umgekehrte Semantik dasselbe. 

Zur Oberpriifung des Zustandes einer PAE bei der Konf iguration 
wird beim Absenden der Adresse der Ziel-PAE eines KW die 
STATELUT abgefragt und dement sprechend ein ACK oder REJ 
generiert. Ein KW wird nur dann an eine PAE gesendet f wenn 
kein REJ generiert wurde oder wenn das DIFFERENTIAL Flag 
gesetzt ist. 

Durch dieses Verfahren ist die zeitliche Reihenfolge der KW 
sichergestellt . Nur gtiltige KW werden zu den PAEs gesendet. 
Nachteilig ist der Aufwand der Implementierung der STATELUT 
sowie die Riicksendung der PAE-Zustahde an die STATELUT und die 
dazu erforderliche Busbandbreite und Laufzeit. 



5.2 Umsortieren der KW 
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Wesentlichi ftir die Ariwendung des nachfolgenden Verfahrens ist 
die Verwendurig des CHECK-Flags f iir jedes erste an eine PAE 
gesendete KW (KW1) ...... 

Die SubConf wird wie folgt umsortiert: 

1. Zuerst wird KW1 einer ersten PAE beschrieben. In der Zeit 
. (DELAY) bis zum Eintreffen der Quittung (ACK/REJ) folgen 

exakt so viele Leerzyklen (NOPs), wie Takte vergehen. 

2. Danach wird das KW1 einer zweiten PAE beschrieben. 
WcLhrend DELAY kSnnen die restlichen KW der ersten PAE 
beschrieben werden. Eventuell restliche verbleibenden 
Takte werden mit Leerzyklen aufgefiillt. Der 
Konfigurationsblock von KW1 bis zum Ablauf von DELAY wird 
Atom genannt. 

3. Bei jeder weiteren PAE wird ebenso verfahren. 

4. Werden bei einer PAE mehr KW beschrieben als Takte 
wahrend DELAY anstehen, wird der verbleibende Teil auf 
die nachfolgenden Atome verteilt. Alternativ kann das 
DELAY auch aktiv verlangert werden, wodurch eine grSBere 
Anzahl von KW im selben Atom geschrieben werden k6nnen. 

Bei Eintreffen von ACK fur ein KW1 werden alle weiteren KW fur 
die entsprechende PAE konfiguriert. Sofern die PAE mit RE J 
quittiert, wird kein weiteres, die PAE betref fendes, KW 
konfiguriert. 

Das Vfcrfahren gewahrleistet die Einhaltung der Reihenfolge der 
Konf iguration . 
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Nachtellig ist, daft' nicht die optimale 

Konf iguratiprisgeschwindigkeit "erreicht werdeh .kann. Da zur 
Einhaltung der Reihenfolge die Wartezeit eines Atoms 
gegebenenfalls mit Leerzyklen (NOPs) geftillt werden mufi sinkt 
die nutzbare Bandbreite und die Gr6fte einer SubConf nimmt 
durch die NOPs zu. 

Weiterhin bereitet ein Paradoxon eine nicht Itfsbare 
Eirischrankung der Konfigurationsgeschwindigkeit: 
Urn die Menge der Konfigurationsdaten und -zyklen moglichst 
gering zu halten, sollte die Zahl der Konfigurationsregister 
moglichst klein gehalten werden. Da bei hoheren Frequenzen 
DELAY zwangsweise grower wird, kollidiert dies mit der 
Forderung, DELAY sinnvoll durch das Auffiillen mit KW zu 
nut z en. 

Das Verfahren scheint daher nur bei serieller Obertragung der 
Konfigurationsdaten sinnvoll einsetzbar zu sein. Durch die 
Serialisierung der KW ist der Datenstrom ausreichend lang, um 
die Wartezeit zu ftillen. 

5.3 Auswerten der ACK/REJ Quittlerung mit Latency 
(CHECKACKREJ) 

Das CHECK-Signal wird mit den KW uber eine oder mehrere 
Pipeline-Stufen an die adressierte PAE gesendet. Die 
adressierte PAE quittiert (ACK/REJ) ebenfalls gepipelinet an 
die CT. 
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In jedem Takt wird ein KW abgesendeit, dessen Quittung 
(ACK/REJ) erst n-Takte spater bei der CT ankommt. und 
ausgewertet wird. Wahrend dieser Zeit werden jedpch n weitere 
KWs gesendet. Daraus ergeben sich zwei Problemebereiche: 

• Steuerung des FILMOs 

• Einhaltung der Reihenf olge der KWs 

5.3.1 Steuerung des FILMOs 

Innerhalb des FILMO mufl vermerkt werden, welche KW von einer 
PAE akzeptiert wurde (ACK) und welche zurtickgewiesen wurden 
(REJ) . Die zurtickgewiesenen KW werden in einem spateren FILMO 
Durchlauf erneut gesendet. Bei diesem spateren Durchlauf ist 
es aus Grtoden der Konfigurationsef f izienz sinnvoll, nur die 
KWs zu durchlauf en f die zurtickgewiesen wurden. 
Die beschriebenen Anforderungen sind wie folgt realisierbar : 
Dem FILMO wird ein weiterer Speicher (RELJMP) zugeordnet f der 
dieselbe Tiefe wie der FILMO aufweist. Ein erster Zahler 
(ADR_CNT) zeigt auf die Adresse des KW im FILMO, das aktuell 
in das PAE-Array geschrieben wird. Ein zweiter ZcLhler 
( ACK/RE J_CNT ) zeigt auf die Position des KW im FILMO, dessen 
Quittung (ACK/RE J) aktuell aus dem Array zurtickkommt . Ein 
Register (LASTREJ) speichert den Wert von ACK/RE J_CNT, der auf 
die Adresse des letzten KW zeigt, dessen Konfiguration mit REJ 
quittiert wurde. Ein Subtrahierer errechnet die Differenz 
zwischen ACK/RE J_CNT und LASTREJ. Beim Auftreten eines REJ 
wird diese Differenz in die Speicherstelle mit der Adresse 
LASTREJ im Speicher RELJMP geschrieben. 
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RELJMP enth&lt' soiiiit die relative Sprungweiite zwischen einem 
zuradkgewieserien . KW und dessen Nachfblger. 
. 1. Jedem akzeptierten KW.ist ein RELJMP-Eintrag „0" (null) . 
zugewiesen. 

2. Jedem zurtickgewiesenen KW ist ein RELJMP-Eintrag „>0" 
(grQBer null) zugewiesen. Durch Addition der aktuellen 
Adresse mit dem RELJMP-Eintrag wird die Adresse des 
nSchsten zurtickgewiesenen KWs im FILMO berechnet. 

3. Dem letzten zurtickgewiesenen KW ist ein RELJMP-Eintrag 
„0" (null) zugewiesen, wodurch das Ende angezeigt wird. 

Die Speicherstelle der ersten Adresse einer SubConf ist mit 
einem NOP im FILMO belegt. Der zugeordnete RELJMP enthalt den 
relativen Sprung zum ersten abzuarbeitenden KW. 

1. Beim ersten Durchlauf des FILMO ist der Wert „1" (eins) . 

2. Bei einem folgenden Durchlauf zeigt der Wert auf das 
erste abzuarbeitenden KW, ist also „>()" (groiier null) . 

3. Sofern alle KWs der SubConf konfiguriert wurden, ist der 
Wert „0" (null) . Woran die Zustandsmaschine die 
vollstandig Abarbeitung der Konf iguration feststellt. 

5.3.2 Einhalfcung der Reihenf olge (BARRIER) 

Bei dem unter 5.3 beschriebenen Verfahren ist es nicht mSglich 
eine bestimmte Konf igurationsreihenf olge zu garantieren. Das 
Verfahren stellt lediglich die FILMO Anforderungen nach 2.1 
a)-c) sicher. 



45 



WO 02/13000 



PCT/EP01/06703 



in bestiimtiten Applikationen ist die Einhaltung der 

Konf igurationsreiherif olge innerhalb einef SubConf ( 2 . 1 e) ) ,. 

sowie die Einhaltung der Konf igurationsreihenf olge der 

einzelnen SubConf selbst f relevant (2.1 d) ) . 

Die Einhaltung von Reihenfolgen wird derart erreicht, dafi 

SubConf in iaehrere Bldcke partitioniert werden. Zwischen den 

einzelnen Blocken wird ein Token (BARRIER) eingefilgt, das nur 

iiberspruhgen wird, wenn keines der vorhergehenden KW 

zurttckgewiesen (REJ) wurde. 

Trifft die konf iguration auf eine BARRIER und es traten zuvor 
REJ auf, darf die BARRIER nicht Obersprungen werden. 
Es wird zwischen wenigstens zwei Arten von BARRIERS 
unterschieden : 

a) NonBlocking: Die Konf iguration wird mit der nachf olgenden 
SubConf fortgefuhrt. 

b) Blocking: Die Konf iguration wird mit weiteren Durchlaufen 
der aktuellen SubConf fortgeftihrt. Die BARRIER wird erst 
tibersprungen, wenn die aktuelle SubConf vollstandig 
konfiguriert wurde. 

Oberlegungen zur Optimierung der Konf igurations- 
geschwindigkeit : 

GewShnlicherweise ist die Einhaltung der Reihenf olge der 
Konf iguration der einzelnen KW nicht notwendig. Allerdings muB 
die Reihenfolge der Aktivierung der einzelnen PAEs (GO) exakt 
eingehalten werden. Die Geschwindigkeit der Konf iguration ist 
steigerbar, indem die KWs derart umsortiert werden f daB 
sMmtliche KWs bei denen das GO-Flag nicht gesetzt ist, vor die 
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BARRIER gezogen werden; Ebenf alls miissen sMmtiiche KW mit 
gesetztem CHECK- Flag vor die BARRIER gezogen werden. Wird eine 
PAE mit nur einem KW kqnfiguriert, muB das KW in zwei Worte 
aufgespalten werden, wobei das CHECK- Flag vor der BARRIER 
gesetzt ist und das GO-Flag nach der BARRIER. 

An der BARRIER ist bekannt, ob samtliche CHECKS mit ACK 
quittiert wurden. Da eine ZurOckweisung (RE J) nur mit 
gesetztem CHECK- Flag auftritt, werden alle KW hinter der 
BARRIER gruhdsatzlich in der richtigen Reihenfolge ausgeftihrt. 
Die KW hinter der BARRIER werden exakt nur einmal durchlauf en 
und der Start der einzelnen PAEs verlauft ordentlich. 

5.3.3 Garbage Collector 

FUr das Verfahren gemSB 5.3 bieten sich zwei unterschiedliche 
Implementierungen eines Garbage Collectors (GC) an: 

a) Ein als Algorithmus oder einfache S tat ema chine 
implementierter GC. Zu Beginn zeigen zwei Zeiger auf die 
Startadresse des FILMOs: Ein erster Zeiger (ReadPointer) zeigt 
auf das aktuelle vom GC zu lesende KW, ein zweiter 

Zeiger (WritePointer) zeigt auf die Position auf die das KW 
geschrieben werden soil. ReadPointer wird linear 
ankrementiert. Jedes KW, dessen RelJmp ungleich „0" (null) 
ist/ wird auf die Adresse WritePointer geschrieben. RelJmp 
wird auf „1" gesetzt und WritePointer wird inkrementiert . 

b) Der GC wird in den FILMO integriert, indem zu dem 
Auslesezeiger des FILMOs ein WritePointer hinzugefttgt wird. 
Der WritePointer zeigt bei Beginn des FILMO-Durchlaufs auf den 
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ersten Eintrag. Jedes KW, das beim Konf igurieren einer PAE init 
einem RE J zurtickgewiesen wurde, wird auf die Speicherstelle 
geschrieben, auf die WritePointer zeigt. Danach wird 
WritePointer inkrementiert . Ein zusatzlich FIFO-ahnlicher 
Speicher (z.B. auch ein Schiebregister) ist erforderlich, der 
das an eine PAE gesendeten KW in der richtigen Reihenfolge 
; solange zwischenspeichert, bis das zum KW gehOrende ACK/REJ 
wieder beim FILMO eintrifft. Beim Eintreffen eines ACK wird 
das .KW ignoriert. Beim Eintreffen von RE J wird (wie bereits 
beschrieben) das KW an die Speicherstelle geschreiben, auf die 
WritePointer zeigt. Der Speicher des FILMO ist dabei 
vorzugsweise als ein Multiport Speicher ausgestaltet . 
Bei diesem Verfahren ergibt sich zum Ende eines jeden FILMO- 
Durchlaufes ein neuer Speicheraufbau, bei welchem die nicht 
konf igurierten KW linear am Beginn des Speichers stehen. 
Ztisatzliche GC Durchl5ufe sind nicht notwendig. Ebenfalls kann 
auf die Implementierung von RelJmp und der dazugehorenden 
Logik vollstandig verzichtet werden. 

5.4 Pref etchen der ACK/REJ Quittxerung mit: Latency 

AbschlieBend soil eine Weiterentwicklung von 5.3 beschrieben 
werden. Nachteil dieses Verfahrens ist die vergleichsweise 
hohe Latenzzeit die der dreifachen Lange der Pipeline 
entspricht. 

Die Adressen und/oder Flags der jeweils zu konf igurierenden 
PAEs werden auf einem getrennten Bussystem vor der 
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eigentlichen Konf iguratibn abgesendet. Das Timing ist derart 
ausgelegt , daB zuih Zeitpurikt diss gewoilten eigentlichen 
Einschreibens des Konf igurationwortes in eine PAE dessen 
ACK/REJ Information vorliegt. Sofern mit ACK quittiert wurde, 
wird die KON F I GURAT I ON durchgeftthrt; bei einer Zuriickweisung 
(REJ) werden die KW nicht an die PAE gesendet (ACK/REJ- 
PREFETCH) . Durch das FILMO Erotokoll, insbesondere das LOCK, 
ist sichergestellt, daB zwischeh ACK/REJ-PREFETCH und der 
•KONFIGUEIATION kein unerlaubter Statuswechsel der PAEs 
stattf indet . 

5,4.1 Aofbau des FILMDs 

Der FILMO funktioniert wie folgt: Die KW werden in korrekter 
Reihenfolge erhalten, entweder (i) aus dem Speicher der CT 
oder (ii) aus dem FILMO- Speicher . 

Die PAE-Adressen der ausgelesenen KW werden uber ein erstes 
Bussystem gepipelinet an die PAEs gesendet. Die kompletten KW 
werden in einen FIFO-artigen Speicher mit fester 
Verzogerungszeit (der beispielsweise auch als Schieberegister 
ausgestaltet sein kann) geschrieben. 

Die jeweils adressierte PAE quittiert abhSngig von ihrem 
Status durch Senden von ACK oder REJ. Die Tiefe des FIFOs 
entspricht der Anzahl von Takten, die zwischen dem Absenden 
der PAE-Adresse an eine PAE und dem Eingang der Quittung der 
PAE vergehen. Der Zyklus vom Absenden der Adresse an eine PAE 
bis zum Eintreffen der Quittung der PAE wird Prefetch genann. 
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Durcti die bestimmte Verzogerung im FIFO-artigen Speicher, der 
hier nicht i&entisch itiit derri FILMO ist, trifft die Quitturig 
einer PAE exakt zu dem Zeitpunkt bei der CT ein> zu dem auch 
das zu der PAE gehorende KW am Ausgang des FIFOs ansteht. 
Beim Eintreffen von ACK wird das KW an die PAE versendet, eine 
Quittierung wird nicht mehr erwartet. Der PAE Zustand hat sich 
zwischenzeitlich nicht unerlaubt geandert, die Annahme ist 
garantiert. 

Beim Eintreffen von RE J wird das KW nicht an die PAE gesendet, 
sondern zuruck in den FILMO-Speicher geschrieben. Dafilr steht 
ein zusatzlicher Zeiger zur Verftlgung f der bei Beginn des 
linearen Auslesens des FILMO-Speichers auf die erste Adresse 
zeigt. Mit jedem zurttckgeschriebenen Wert wird der Zeiger 
inkrementiert. Dadurch werden automatisch die zurUckgewiesenen 
KWs linear gepackt f was einem integrierten Garbage-Kollektor 
Durchlauf entspricht. (siehe auch 5.3). Diese Implementierung 
ist besonders vorteilhaft und wird ftir sich genommen als 
schutzfahig angesehen. 

5.4.2 Senden und Quittieren tibar eine Regis terpipeline 

Das hier beschriebene Verfahren dient der Sicherstellung einer 
einheitiichen Taktverzdgerung zwischen gesendeten Mitteilungen 
und empf angenen Antworten darauf f wenn zwischen einem Sender 
und mehreren mOglichen EmpfSngern von Mitteilungen 
unterschiedliche Anzahlen von Registern geschaltet 
sind. Ein Beispiel daftlr ist, wenn Empf^nger unterschiedlich 
weit vom Sender entfernt sind. Die gesendete Mitteilung darf 
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dabei naheliegende Empf anger friiher erreichen als weiter 
entferrite. : . '■• 

Urn eine gleiche Laufzeit ftir alle Antworten zu erreichen, wird 
die Antwort vom Empfanger nicht direkt zurtickgeschickt, 
sondern weiter bis zu einem vom Sender am weitesten entfernten 
Empf anger. Dieser Weg muB dabei genau soviele Register 
aufweisen, daB die Antwort zu dem Zeitpunkt ankommt, an dem 
auch eine mit der ersten Nachricht gleichzeitg abgeschickte an 
diesem Punkt angekommen ware. Von hier aus erfolgt das 
Zurtickschicken genauso, als wenn die Antwort in diesem 
Empf anger selbst erzeugt wurde. 

Ob die Antwort tatsSchlich bis zu einem am weitesten 
entfernten Empfanger geschickt wird oder in eine andere Kette 
mit Registern, die das gleiche Zeitverhalten hat, ist dabei 
unerheblich. 



6. Hierarchisches CT-Protolcoll 

Wie in PACT10 beschrieben, sind VPU-Bausteine skalierbar, , ? . 
indem ein Baum aus CTs aufgebaut wird, an dessen Biattern 
jeweils die niedersten CTs (Low-Level-CTs) der PAs angeordnet 
sind. Eine CT mit dem ihr zugeordnetem PA wird PAC genannt. 
Generell k5nnen beliebige Daten oder Befehle zwischen den CTs 
ausgestauscht werden. Hierzu kann zunSchst jedes technisch 
sinn voile Protokoll verwendet werden. 
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Sofern die Kommunikation (Inter-CT-Kornmunikation) allerdings 
das Starten von SubConf auf verschiedenen Low-Levei-GTs 
innerhalb des CT-Baums (CTTREE) bewirkt, sollen die 
Anforderungen des FILMO-Prinzips sichergestellt sein, urn die 
Deadlock- Freiheit zu gewahrleisten. 
Generell sind zwei Falle zu unterscheiden: 

1. Bei einer Low-Level-CT wird der Start einer SubConf 
angefordert, die ausschlieMich lokal auf der Low-Level- 
CT und dem ihr zugeprdneten PA lauft. Dieser Fall kann 
jederzeit innerhalb des CTTREE bearbeitet werden und 
bedarf keiner besohderen Synchronisation rait anderen LOW- 
LEVELJZTs . 

2. Bei einer Low-Level-CT wird der Start einer Konfiguration 
angefordert, die auf mehreren Low-Level-CTs und den ihnen 
zugeordneten PAs lauft. In diesem Fall mufi darauf 
geachtet werden, daft der Aufruf der Konfiguration auf 
alien beteiligten CTs atomar, also untrennbar verlauft. 
Am einfachsten ist es, hinreichend sicherzustellen, dafi 
wahrend des Aufrufes und des Starts einer bestimmten 
SubConf keine andere gestartet wird. Ein derartiges 
Protokoll ist aus PACT10 bekannt. Es ist aber ein noch 
weiter optimiertes Protokoll wiinschenswert . 

Das Protokoll aus PACT10 ist ineffizient, sobald eine 
gepipelinete Obertragung bei hoheren Frequenzen notwendig ist, 
da die Buskonimunikation einer grofien Latenzzeit unterliegt. 

In den folgenden Abschnitten wird ein Verfahren ausgeftihrt. 
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Wesentliche Aiifgabe der Intef-CT-Koriraiunikation i3t 
sicherzustellen, dafi PAC tibergreifende SubConf (Enhanced 
SubConf iguration = EnhSubConf) deadlockfrei gestartet werden. 
EnhSubConf sind SubConf die nicht nur auf einer PAC lokal, 
sondern auf mehreren PACs verteilt ausgeftihrt werden. Eine 
EnhSubConf beinhaltet mehrere SubConf, die jeweils iiber die 
beteiligten Low-Level-CTs gestartet werden. Als PAC wird dabei 
eine PAE-Gruppe mit wenigstens einer CT vers tanden. Urn die «■ 
Deadlockf reiheit sicherzustellen, ist f olgende Bedingung 
notwendig: 

Damit mehrere EnhSubConf deadlockfrei auf identischen PACs 
laufen k6nnen, wird - zum Beispiel innerhalb des CTTREEs - 
durch einen geeigneten Mechanismus eine Priorisierung ihrer 
Ausfahrung festgelegt. Sofern dabei von mehreren 
unterschiedlichen EnhSubConf aus SubConf gestartet werden 
sollen, die auf ein und denselben PACs ablaufen, erfolgen auf 
den jeweiligen PACs die Starts dieser SubConf in der 
zeitlichen Reihenfolge entsprechend der Priorisierung der 
EnhSubConf. 

Beispiel: Zwei EnhSubConf sollen gestartet werden, namlich 
EnhSubConf -A auf den PACs 1,3,4,6 und EnhSubConf -B auf den 
PACs 3,4,5,6. Es mufi sichergestellt sein, daB auf den PACs 
3,4,6 iramer EnhSubConf -A ausschlieBlich entweder vor oder nach 
EnhSubConf-B konfiguriert wird. Sollte beispielsweise auf PAC 
3 und 4 EnhSubConf -A vor EnhSubConf-B und auf PAC 6 
EnhSubConf-A nach EnhSubConf-B konfiguriert werden liegt ein 
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Deadlock vbr, da EnhSubConf -A nicht auf PAC 6 und ErihSubC6rif-B 
nicht auf PAC 3 uhd 4; gestartet werden kdnnte. Ein derartiger 
Fall wird iiti weiteren Kreuz oder gekreuzt genannt. 

Es ist ausreichend zu verhindern, daB sich EnhSubConf kreuzen. 
Sollte eine algorithmische Abhangigkeit zwischen zwei 
EnhSubConf bestehen, also daB aufgrund des Algorithmus eine 
EnhSubConf nach der anderen gestartet werden muB, wird dies 
normalerweise dadurch aufgel5st, daB eine EnhSubConf die 
andere startet. 

Ausfuhrungsbeispiel far das erfindunggem^Be Protokoll: 
Die Inter-CT-Kommunikation unterscheidet zwischen zwei 
Datenarten: 

a) einer SubConf, die die Konfigurationsinformation enthalt, 

b) einer IDChain, die eine Liste aus zu startenden IDs 
enthalt; zusammen mit der Angabe, auf welchem PAC die 
durch die ID referenzierte SubConf gestartet werden soil. 
Durch eine IDChain wird eine EnhSubConf auf die einzelnen 
auszufiihrenden SubConf tibersetzt: IDBnnsubConf ^ 

IDChain { (PACi : ID Su bconfi) t ( PAC 2 : ID S ubconf2) , ( PAC 3 : 

IDsubCon£3) / ••• (? A ^n • IDsubCqnfn) } 

Die Inter-CT-Komraunikation unterscheidet zwischen folgenden 
Obertragungsmodi : 

BEQUEST: Der Start einer EnhSubConf wird von einer Low-Level- 
CT, bei der ihr iibergeordneten CT angefordert - oder von einer 



54 



WO 02/13000 



PCT/EP01/06703 



tibergeordneten CT bei der ihr wiederum ttbergeordrieten 
ahgefdrdert. Dies wiederhdlt sicti so lange, bis entweder eine . 
CT erreicht ist, die die IDChain gespeichert hat, Oder. die 
RootCT erreicht ist, die die IDChain immer iia Speicher hat. 
GRANT: Eine Qbergeordnete CT beauftragt eine tief erliegende CT 
mit dem Start einer SubConf . Entweder handelt es sich um eine 
einzelne SubConf oder mehrere SubConf gemaii der IDChain. 
GET: Eine CT fordert bei der ihr ubergeordneten CT eine 
SubConf durch Senden der entsprechenden ID an. Sofern die 
tibergeordnete CT die SubConf gespeichert (gecached) hat, 
sendet sie diese an die tief ere CT, ainsonsten fordert sie 
wiederum bei der ihr ubergeordneten die SubConf an und sendet 
diese an die Tief ere nach Erhalt. Spatestens die RootCT hat 
die SubConf gespeichert. 

DOWNLOAD : Das Laden einer SubConf auf eine tiefergelegene CT. 

REQUEST lauft so lange den CTTREE hoch, bis entweder die 
RootCT, das heifit die Wurzel (die h5chste CT) im CTTREE, 
erreicht ist, oder eine CT im CTTREE die IDChain gespeichert 
hat. Die IDChain Jcann nur von einer CT gespeichert werden, die 
sSmtliche in der Liste der IDChain beeinhalteten CTs, als 
Blatter oder Zweige besitzt. Die RootCT hat in ihrem Speicher 
:(CTR, vgl. PACT10) grundsatzlich Zugriff auf die IDChain. 
Danach wird GRANT an alle in der IDChain aufgelisteten CTs 
gesendet. Das Senden von GRANT geschieht atomar, d.h. alle 
Zweige einer CT erhalten GRANT entweder gleichzeitig oder 
sequentiell, jedoch ohne Unterbrechung durch eine andere 
Aktivitat zwischen einer der betreffenden CTs und irgend einer 



55 



WO 02/13000 



PCT/EP01/06703 



anderen, die die ReiHenfolge der Starts def SubConf 
verschiedener EhhSubConf auf den PACs beeinf luflt . ' :. . 
Wichtig 1st, daB eine Low-Leyel-CT, bei der GRANT eintrifft,. 
sofort und unterbrechungsfrei die entsprechende SubConf in das 
PA konfiguriert, in den FILMO schreibt oder in eine Liste 
schreibt, aus der die Konf igurationsreihenfolge hervorgeht, 
das heiBt, wann genau die SubConf auf den FILMO geschrieben 
bzw. in das PA konfiguriert werden muB. Die Reihenfolge ist 
.wesentlich, urn einen Deadlock zu vermeiden. Sofern die SubConf 
nicht bereits in der Low-Level-CT gespeichert ist/ mufi die 
Low-Level-CT die SubConf mittels GET bei der ihr 
iibergeordneten CT anfordern. Um dem erfindungsgemaBen 
Verfahren zu genUgen, diirfen zwischen GET und dem Eintreffen 
der SubKonf (DOWNLOAD) , sofern es der Algorithmus zulSBt oder 
erfordert, lokale SubConf (d.h. SubConf die nicht von einer 
EnhSubConf aufgerufen werden sondern nur das lokale PA 
betreffen) konfiguriert oder in den FILMO geladen werden. 
SubConf einer weiteren EnhSubConf, die von einem spMteren 
eintreffenden GRANT gestartet werden, diirfen ausschlieBlich 
nach dem Eintreffen von DOWNLOAD, sowie der Konf iguration bzw. 
dem Laden in den FILMO gestartet werden. 

Beispiele fiir den Aufbau von SubConf sind aus den 
Patentanmeldungen PACT 6 5 und PACT10 bekannt. Ein wesentlicher 
Unterscheid des erfindungsgemaBen Verfahrens ist die separate 
Behandlung von Aufrufen von SubConf durch IDChains. Dabei ist 
eine IDChain eine besondere Ausgestaltung einer SubConf mit 
folgender Eigenschaft: 
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Aus Performancegranden ist es sinnvoll, einzelne SubCohf 
ihrierhalb des CTTREE zu speicherri, sozusagen zu cachen . Bel 
Bedarf muB eine SubConf dann nicht komplett neu geladen 
werden, sondern wird von einer CT, die die entsprechende 
SubConf cached, direkt an die untergeordneten CT gesendet. Bei 
einer IDChain ist wesentlich, daB von einer zentralen CT aus, 
alle untergeordneten CTs entsprechend des erfindungsgemMBen 
Protokolls geladen werden. Dazu ist es am Ef f izientesten, wenn 
die sich am Tiefsten im CTTREE befindende CT, die noch 
sSmtliche in der IDChain benannten PACs als Blatter besitzt, 
die IDChain cached. Noch tiefer liegende CTs diirfen nicht mehr 
cachen, da sie nicht mehr zentral tlber alien PACs der IDChain 
liegen. H6herliegende CTs verlieren an Effizienz, da ein 
langerer Kommunikationspf ad notwendig ist. Hat ein Request eine 
CT mit vollstandiger IDChain ftir die angeforderte EnhSubConf 
erreicht, I6st diese CT GRANTS an die beteiligten 
tieferliegenden CTs aus, wobei die Inf ormationen aus der 
IDChain derart aufgeteilt werden (Splitting), daB zumindest 
der Teil jeweils iibertragen wird, der in den jeweiligen 
Zweigen bentftigt wird- Um bei diesem Splitting das Kreuzen zu 
verhindern, muB sichergestellt sein, daB auch die nfictiste CT 
Stufe alle GRANTS ihres Teils der EnhSubConf auslost, und zwar 
iohne von GRANTS anderer EnhSubConf unterbrochen zu werden. 
Eine M5glichkeit dies zu realisieren ist, die betreffenden 
Teile der IDChain atomar zu iibertragen. Um das Caching von 
IDChains zu steuern ist es sinnvoll, eine geteilte IDChain 
Wclhrend der Obertragung zu kennzeichnen, beispielsweise durch 
ein „SPLIT" Flag. 
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Eine IDChain wird geteilt, sobald sie auf eine CT geiaden 
wird, die innerhalb: der Hierarchie des CTTREE nicht mehr 
. zentral .ttber .samtlichen innerhalb der IDChain referenzierten 
PACs liegt. In diesem Fall wird die IDChain nicht mehr von 
einer einzelnen CT innerhalb der Hierarchie verwaltet und 
gecached. Mehrere CTs verarbeiten jeweils den Teil der 
IDChain, der jeweils die PACs enthalt, die Blatter der 
jeweiligen CT sind.Ein REQUEST miifi iirimer bis zu einer CT 
weitergeleitet werden, die alle betreff enden PACs verwaltet. 
Das bedeutet, die hierarchisch erste und auch effizenteste CT 
(von den PACs aus betrachtet) , die REQUEST in GRANT umwandeln 
kann, ist die erste CT in auf steigender Ordnung ausgehend von 
den BISttern, die eine komplette ungeteilte IDChain besitzt. 
Die Verwaltung der Liste mit den Zuweisungen von PAC zu ID 
bedarf keiner weiterer Eriauterung. Die Liste kann entweder 
von einem, innerhalb einer CT ablaufenden, Prograram 
verarbeitet werden, oder aus einer Reihe von 
Assembleranweisungen zur Ansteuerung der untergeordneten CTs 
ausgestaltet sein. 

Eine komplette IDChain ist folgendermafien aufgebaut: 
IDEnhsubconf -> IDChain {SPLIT, (PAC X : ID Su bconfi) / ( PAC 2 : 

ID S ubConf2) / ( PAC 3 : ID Su bConf3) / (PAC n : IDsubConfo) } 

6.1 Precachen von SubConf 

Innerhalb des CTTREEs werden SubConf nach bestimmten 
Bedingungen vorgeladen, d.h. gecached bevor sie eigentlich 
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ben5tigt "werden. '''Dieses Verfahreri steigett die Performance 
innerhalb des CTTREE erheblich. 
Ausf iihrungsbeispiele : 

Es stehen eine Vielzahl von precache Anforderungen zur 
Verfttgung. Die zwei haufigsten sind: 

a) Innerhalb einer aktuell auf einer Low-Level-CT 
verarbeiteten SubConf ist eine Ladeauf f orderung fur eine 
weitere SubConf programmiert . 

b) WShrend der Datenverarbeitung innerhalb des PAs wird 
entschieden welche SubConf vofzuladen ist. Die dem PA 
zugeordnete CT wird durch einen Trigger* der innerhalb der CT 
entsprechend auf die ID einer SubConf tibersetzt wird, 
aufgefordert eine SubConf vorzuladen. Es ist auch mSglich, daii 
die ID einer SubConf im PA berechnet wird oder vorher dort 
konfiguriert wurde. Dann enthait die Mitteilung an die 
zugeordnete CT die ID direkt. 

Die zu ladende SubConf wird nur gecached, jedoch nicht 
gestartet. Der Start erfolgt erst zu dem Zeitpunkt an dem die 
SubConf ohne das vorherige cachen gestartet worden ware. Der 
Unterschied ist, daB zuin Zeitpunkt der Startanf orderung die 
SubConf bereits in der Low-Level-CT oder einer der mittleren 
CTs gespeichert ist und daher entweder sofort konf icruriert 
wird oder sehr schnell auf die Low-Level~CT geladeh und danach 
gestartet wird. Das zeitaufwendige Durchlaufen des gesamten 
CTTREE entfailt. 
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.Durch einen Compiler/ der die SubConf generiert, ist 
entscheidbar, welche SubConf jeweils als nSchste gecached - 
werden sollten. Innerhalb des Programmablaufgraphen ist 
ersichtlich, welche SubConf als nachste ausgefuhrt werden 
kSnnten. Diese werden jeweils gecached. Die Programmausftihrung 
entscheidet zur Laufzeit, welche der gecachten SubConf 
tatsSchlich gestartet werden. 

Entsprechend des Mechanismus bestimmte SubConf vorzuladen 
. (precache) ist ein Mechanismus implement iert, der gecachte 
SubConf entfernt, urn ira Speicher der CTs Platz fiir andere 
SubConf zu schaffen. Ebenso wie das Vorladen ist das Loschen 
bestimmter SubConf durch den Compiler anhand des 
Programmausf iihrungsgraphen vorhersagbar . 
Zusatzlich sind in den CTs die ublichen Mechanismen zum 
Loschen von SubConf implementiert (z.B. der zuletzt 
Konf igurierten, der zuerst Konfigurierte, der am seltensten 
Konf igurierten (siehe PACT10)), um den Speicher der CTs 
entsprechend zu verwalten. Wesentlich ist, daB nicht nur 
explizit vorgeladene SubConf ISschbar sind, sondern generell 
jede SubConf in einem CT-Speicher. Sofern der Garbage- 
Kollektor die bestimmte SubConf bereits entfernt hat, verliert 
die explizite Loschung ihre Gilltigkeit und wird ignoriert. 

Eine explizite Loschung kann durch einen Befehl bewirkt 
werden, der von einer beliebigen SubConf gestartet werden 
kann. Dies beinhaltet eine beliebige CT innerhalb des Baumes, 
die eigene CT oder sogar die explizite LSschung derselben 
SubConf (d.h. das Ldschen der eigenen SubConf in der der 
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Befehi steht, wobei dabei das korrekte Termihieren 
■■; sichergestellt werden muB) . . - ; 

Eine weitere Moglichkeit der expliziten Loschung ist, 
innerhalb der PAs aufgrund eines bestimmten Zustandes einen 
Trigger zu generieren, der an die CT weitergeleitet wird und 
als Anforderung zur expliziten Loschung ausgewertet wird. 

6.2 Abhangigkeiten zwischen den PAEs 

FQr den Fall, daB die Reihenfolge, in der PAEs verschiedener 
PACs, die zu einer EnhSubConf gehdren, konf igurieirt werden,- 
nicht unerheblich ist, wird zur Sicherstellung der Einhaltung 
dieser zeitlichen Abhcingigkeit ein weiteres Verfahren 
vorgeschlagen. Da bei raehreren PACs def initionsgemaB auch 
mehrere CTs existieren, verstSndigen sich diese untereinander, 
um die Information auszutauschen, ob bisher alle PAEs f die vor 
den in jeder PAC n^chsten konfiguriert sein miissen, bereits 
ihr GO aus derselben Konf iguration akzeptiert haben. 
Eine Moglichkeit, die zeitlichen AbhMngikeiten aufzulosen und 
das Senden von nicht erlaubten GOs zu verhindern, ist, 
zwischen den CTs das exklusive Recht zum Konf igurieren 
auszutauschen und die KW so umzuordnen, daB eine korrekte 
Reihenfolge durch die TVbfolge ihrer Konf iguration und die 
Obergabe des Konf igurationsrechts sichergestellt wird. Je 
nachdem, wie stark die AbhSngikeiten sind, kann es auch 
genttgen, wenn beide CTs bis zu einem Synchronisationspunkt 
parallel ihr zugeornetes PA konfigurieren, dann aufeinander 
warten und danach bis zum nachsten Synchronisationspunkt oder 
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- falls nicht vorhanden - bis zum Ende der EnhSubConf parallel 
weiter konf igurieren. **'-" : "/ 

7. SubConf Makros 

Besonders effizient ist das Cachen von SubConf, wenn m5glichst 
viele SubConf gecached werden k6nnen^ Insbesondere im Hinblick 
auf Hochsprachencompiler ist der effiziente Einsatz des 
Cachings sinnvoll, da Compiler auf Assemblerebene - in der 
VPU-Technologie SubConf Ebene - Mufig wiederkehrende Routinen 
erzeugen. 

Urn SubConf moglichst hcLufig wiederzuverwenden, sollen SubConf- 
Makros (SubConfM) mit folgender Eigenschaft eingefiihrt werden 

• es werden keine absoluten PAE-Adressen angegeben. 
Vielmehr ist eine SubConf ein vorgelayoutetes Makro, das 
lediglich relative Adressen verwendet; 

• applikationsabhangige Konstanten werden als Parameter 
tibergeben . 

Erst zu dem Zeitpunkt, an dem eine SubConf in das PA geladen 
wird, werden die absoluten Adressen berechnet. Parameter 
werden durch ihre tatsachlichen Werte ersetzt. Dazu wird eine 
modifizierte Kopie der urspriinglichen SubConf derart erstellt, 
dafi entweder (i) diese Kopie in den Speicher der CT abgelegt 
wird (integrierter FILMO) oder (ii) sofort in das PA 
geschrieben wird und nur die zuriickgewiesenen KWs (REJ) in den 
FILMO geschrieben werden (separater FILMO). Besonders im Fall 
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(ii) bietet sich aus PerformancegrUnden eihe Ausgestaltxing des 
Adressaddieters in Hardware an, der direkt am Ihterfacepdrt 
der CT zum PA/FILMO sitzt. Ebenso sind Hardware 
Implementierungen der Parametertransf ormation denkbar, 
beispielsweise durch eine Lookup Tabelle, die vor der 
Konfiguration geladen wird. 

8. Ziiruckspeichera der Caches tatistik 

Aus WO 99/44120 (PACT10) ist eine applikationsabhangige 
Cachestatistik und -steuerung bekannt* Dieses Verfahren bietet 
ein zus&tzlich eine datenabhangige Optimierung des 
Cacheverhaltens, da sich das datenabhangige Programmverhalten 
direkt in der Cacheoptimierung ausdriickt. 

Nachteil des bekannten Verfahrens ist, daB sich das 
Cacheverhalten erst wShrend der Laufzeit optimiert. Bei einera 
Neustart der Applikation ist die Statistik verloren. Oftmals 
noch kritischer ist, daB beim Entfernen einer SubConf aus dem 
Cache auch deren Statistik verloren geht und selbst innerhalb 
der gleichen Applikationsverarbeitung bei einem erneuten 
Aufruf nicht mehr zur Verftlgung steht. 

Erfindungsgem&fi wird vorgeschlagen die Cachestatistik zusamraen 
mit der betreffenden ID beim Terminieren einer Applikation 
oder beim Entfernen einer SubConf aus dem Cache zunachst 
mittels der bekannten Inter-CT-Kommunikation solange an die 
nachsthohere CT zu senden, bis die ROOT-CT die jeweilige 
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Statistik erhait. SubConf Diese speichert die Statistik in 
einem geeigneten Speicher, je nach Anwendung'in einem 
fliichtigen, nicht fliichtigen oder Massenspeicher. Der Zugriff ( 
auf den Speicher erfolgt gegebenenfalls tiber einen Host. Die 
Speicherung erfolgt dabei derart, daB sie der jeweiligen 
SubConf derart zugeordnet ist, daB bei einem Neuladen der 
SubConf die Statistik mitgeladen werden kann. 

SubConf Bei einem Neustart der SubConf wird sie rriit an die Low- 
Level-CT geladen. 

Der Compiler baut entweder eine neutrale leere Statistik auf 
oder generiert nach einem geeigneten Verfahren bereits eine 
Statistik die als zunachst geeignet erscheint- Die vom 
Compiler vorgegebene Statistik wird dann gemafi dem 
beschriebenen Verfahren zur Laufzeit optiraiert/ gespeichert 
und steht bei einem weiteren Aufruf der Applikation in der 
optimierten Fassung zur Verftigung. 
SubConf 

Sofern eine SubConf von mehreren Applikationen oder innerhalb 
einer Applikation von unterscheidlichen Low-Level-CTs benutzt 
wird (oder von unterschiedlichen Roiitinen aus aufgerufen wird) 
ist das Ftihren einer Cache-Statistik nicht sinnvpll, da davon 
;ausgegangen werden muB f daB das jeweils unterschiedliche : 
Aufruf- und Ablauf-Verhalten eine jeweils unterschiedliche 
Statistik hervorrufen wird. 

Je nach Anwendung wird deshalb entweder auf eine Statistik 
verzichtet oder ein SubConf M verwendet. 
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Bei Verwendung eines SubConfM wird die Parametertibergabe 
tieraxt erweitert, daB die Cachestatistik als Parameter, " " " 
Obergeben wird. Terminiert eine SubConfM wird die 
Cachestatistik an die, die SubConfM vormals aufrufende SubConf 
(ORIGIN), zuruckgeschrieben. Die Parameter werden dann 
zusammen mit der Cachestatistik von ORIGIN bei der 
Terminierung von ORIGIN gemaB dera beschriebenen Verfahren 
gespeichert und bei einem riachf olgenden Auf ruf entsprechend 
geladen und als Parameter wiederum an die SubConfM Obergeben. 

Das Ftihren und Speichern von applikationsbezogenen 
Cachestatistiken ist grundsatzlich auch fiir Mikroprozessoren, 
DSPs, FPGAs und Shnliche Bausteine geeignet. 

9. Aofbau des Konfigurationsbus systems 

In PACT 07 wird ein Datenbussystem beschrieben, das adressiert 
und gepipelinet aufgebaut ist. Dieses Bussystem ist generell 
auch zur Dbertragung von Konf igurationsdaten geeignet. 
Um Daten und Konf igurationen Ober dasselbe Bussystem zu 
tibertragen, werden Statussignale eingefuhrt, die die Art der 
iibertragenen Daten anzeigen. 

Das Bussystem wird dabei derart ausgestaltet, daB die CT 
Konf igurations- und Datenregister von einer zuvor von der CT 
adressierten PAE optional zurttcklesen kann. 

Ober das Bussystem werden sowohl globale Daten im Sinne von 
PACT07, als auch KWs ttbertragen. Die CT agiert als eigener 
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Busknoten. Ein Statussigrial kenrizeichnet den 

Obertragungsmodus . Folgender Aufbau mit den Signdlen SO urid SI. 
1st beispielsweise mSglich: 



SI 


so 


Bedeutung 


0 


0 


Daten schreiben 


0 


1 


Daten lesen 


1 


0 


Schreiben eines. KW und/oder einer PAE-Adresse 


1 


1 


Riicksenden eines KW oder beliebigen Registers von 
der adressierten PAE 



Zum Busprotokoll (ACK) nach PACT 07 wird das Signal REJ 
hinzugeftigt, urn der CT Zurdekweisungen gemafl des FILMO- 
Protokolls zu signalisieren. 



10. Zusammenfassen von einzelnen Registem 

Zur logischen Trennung von Konf igurationsdaten werden 
unabhangige Konfigurationsregister verwendet. Die logische 
Trennung ist besonders ftlr die dif ferentielle Konf iguration 
erforderlich, da logisch getrennte Konf igurationsdaten ftir 
gew6hnlich bei der Durchftihriing einer dif ferentiellen 
Konf iguration nicht bekannt sind. Dadurch entsteht eine grofie 
Menge an einzelnen Konf igurationsregistern, wobei jedes 
reinzelne vergleichsweise wenig Information beinhaltet. Im 
folgenden Beispiel sollen die 3-bitigeh Konf igurationswerte 
KW-A^^C/D unabMngig voneinander geschrieben oder modifiziert 
werden konnen: 



0000 


0000 


0000 


0 


KW-A 


0000 


0000 


0000 


0 


KW-B 
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0000 


0000 


0000 


0 


KW-C 


oooo. 


0000 


0000 


0 


KW-D " 



Ein derartiger Registersatz ist ineff izient, da die Bandbreite 
des CT-Busses nur zu einem Bruchteil benutzt wird. 



Der Aufbau von Konfigurationsregistern kann erheblich 
optimiert werden, indem jeweils einem Konf igurationswert ein 
Enable zugeordnet wird, das anzeigt 6b der Wert bei dem 
aktuellen Konf igurationstransfer iiberschrieben werden soil. 

Die Konf igurationswerte KW-A, B f C> D des obigen Beispiels werden 
in einem Konfigurationsregister zusammengefaflt. Jedem Wert 
wird ein Enable zugeordnet. Ist beispielsweise EN-x logisch 
„0" wird KW-x beim aktuellen Transfer nicht verandert, ist EN- 
x logisch „1" wird KW-x durch den aktuellen Transfer 
tiberschrieben. 



En-A 


KW-A 


En-B 


KW-B 


En-C 


KW-C 


En-D 


KW-D 



11. Wave Rekonfiguxation (WRC) 

Aus PACT 13 ist ein Rekonf igurationsverfahren (Wave- 
Rekonfiguration = WRC) bekannt, bei welchem die 
Rekonf iguration direkt und zeitlich rait dem Datenstrom 
synchronisiert ist (Figur 24 in PACT13) . 

Wesentliche ftlr die Funktion der Wave Rekonf iguration ist f dafi 
unkonfigurierte PAEs Daten und Trigger weder annehmen noch 
senden. Das bedeutet, daB sich eine unkonfigurierte PAE 
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vollkoramen neutral verhalt. Dies kann in der VPU-Technologie 
durch die Verwendung der Handshake-Sighale (RDY/ACK) - ftlr 
.Trigger?- und Datenbusse erreicht werden (vgl. PACT 02) i Eine 
unkonfigurierte PAE generiert dabei 

• keine RDYs, wodurch keine Daten oder Trigger gesendet 
werden, 

• keine ACKs, wodurch keine Daten oder Trigger empfangen 
werden . 

Diese Funktionswei.se ist nicht nur ftir die Wave- 
Rekonfiguration hilfreich, sondern 1st eine der moglichen 
Grundlagen ftir die Runtime-Rekonf igurierbarkeit der VPU- 
Technologie. 

Im Folgenden wird eine Erweiterung des Verfahrens ausgefuhrt: 
Die Rekonfiguration wird mit der laufenden Datenverarbeitung 
synchonisiert . Innerhalb der Datenverarbeitung im PA ist 
entscheidbar, 

i. welche nachste SubKonf bei der Rekonfiguration notwendig 
wird; 

ii. zu welchem Zeitpunkt die SubConf aktiv werden muB, also 
mit welchem Datenpaket (ChgPkt) die SubKonf verkntipft 
werden muB. ■ / 

Die Entscheidung, welche Konfiguration geladeh wird, wird 
durch Bedingungen gefailt und durch Trigger 
(WaveConf igurationPreload = WCP) reprMsentiert . 
Die Verkntipfung der Datenpakete mit den KWs einer SubConf wird 
dabei durch die Datenbus- (RDY/ACK) und CT-Bus- 
( CHECK, ACK/RE J ) Protokolle sichergestellt . Ein zusatzliches 
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Signai (WaveConf igurationTrigger = WCT) zeigt an, Bei welchem 
Dateripaket ( ChgPkt ) uirikbhf iguriert werden soli urid ggf . welche 
neue Konf iguration ausgefiihrt, bzw. geladen werden - s.oll . WCT 
kann durch einfache zusatzliche Leitungen oder das 
Trigger system der VPU-Technologie realisiert werden. Mehrere 
WCT kGnnen gleichzeitig im PA verwendet werden, wobei jedes 
Signal eine andere Umkonf iguration steuern kann. 

11.1 Steuerxing der Wave Reconfiguration 

Es kann zwischen zwei applikationsabhangigen WRC unterschieden 
werden : 

Al) Wave Rekonf iguration innerhalb einer SubConf 
A2) Wave Rekonf iguration unterschiedlicher SubConf 

Hardwaretechnisch wird bevorzugt zwischen zwei grundlegenden 
Implementierungsarten unterschieden : 

11) Implementierung in der CT und Ausftihrung jeweils nach 
Anforderung 

12) Implementierung durch zusatzliche Konf igurationsregister 
(WRCReg) in den PAEs. Mogliche Ausgestaltungen der WRCReg 
werden nachfolgend beschrieben. Die WRC werden entweder 

a) bei der ersten Konf iguration der betreffenden SubConf von 
der CT vorgeladen, 

b) oder von der CT wahrend der AusfQhrung einer SubConf 
abhangig von eintreffenden WCP vorgeladen. 

Wahrend der Datenverarbeitung werden die jeweils gtiltigen 
WRCReg durch e in oder mehrere WCT selektiert. 



69 



WO 02/13000 



PCT/EP01/06703 



Im Folgeriden soil die Auswirkung der Wave Reconfiguration auf 
das FILMO-Prinzip diskutiert werden: 

11.1.1 Durchfiihrung der WRC nach Al 
Innerhalb ein und derselben SubConf (Al) 1st die 
Reconfiguration mittels WRC jederzeit m6glich. Zunachst wird 
die SubConf normal konf iguriert, wodurch das FILMO-Prinzip 
sichergestellt ist. Eine Forderung ist, dafi WRCs w^hrend der 
Prograiranausftihrung ausschlieBlich bereits fQr die SubConf 
alloziierte Resourceh yerwenden. . 

Fall II) 

Die WRC wird durch dif f erentielle Konfiguration der 

betreffenden PAEs durchgef iihrt . WCP wird an die CT geleitet. 

Abhangig vom WCP wird auf ein Token innerhalb der 

konf igurierten SubConf gesprungen: 

beginSubConf 

main: 

PAE 1, CHECK&GO 
PAE 2, CHECK&GQ 

PAE n, CHECK&GO 
set TriggeriPortl // WCT 1 
set TriggerPort2 // WCT 2 
scheduler: 

on TriggerPortl do mainl // Jump depending on WCT 
on TriggerPort2 do main2 // Jump depending on WCT 
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wait: 

wait for trigger 
mainl : ...... 

PAE 1, DIFFERENT IAL&GO 
PAE 2, DIFFERENT IAL&GO 

PAE n, DIFFERENT IAL&GO 
wait for trigger 
main2: 

PAE 1, DIFFERENT IAL&GO 
PAE 2 , DI FFERENT IAL&GO 

PAE n, DI FFERENT IAL &GO 
wait for trigger 
endSubConf 

Das Interface (TrglO) zwischen CT und WCP wird durch "set 
TriggerPort" konf iguriert . TrglO verhSlt sich gemaa der FILMO- 
Protokolls wie eine PAE gegeniiber der CT, d.h. TrglO 
entspricht exakt dem CHECK, DIFFERENTIAL/ GO Protokoll und 
antwortet fiir jeden Trigger einzeln oder eine Gruppe gemeinsam 
mit ACK Oder RE J. 

Je nachdem ob ein bestimmter Trigger 
bereits konfiguriert ist mit RE J 

oder 

bereit zur Konf iguration ist mit ACK. 
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Figur 8 aus PACT10 ist urn dieses Protokoll entsprechend zu 
erweitern. • • " • 

Bei Eintreffen von WCT startet die j eweilige PAE die 
entsprechende Konfiguration. 

Fall 12) 

Entweder 

werden die WRCReg bereits wahrend der Konfiguration 
beschrieben und der WCP entfallt f da bereits die komplette 
SubConf in die j eweilige PAE geladen ist 
oder 

abhangig durch bestimmten WCP werden von der CT bestimmte 
WRC in unterschiedliche in der WRC definierte WRCReg 
geladen. Dies ist besonders dann notwendig, wenn ausgehend 
von einer SubConf durch auf tretende WRT in mehrer 
unterschiedliche WRC verzweigt wird als physikalische WRCReg 
vorhanden sind. 

Die TriggerPorts innerhalb der PAE s werden konf iguriert, daft 
durch bestimmte eingehende WRT bestimmte WRCReg selektiert 
werden : 
beginSubConf 
main:' • ' 

PAEl_TriggerPortl 

PAEl_TriggerPort2 

PAEl^WRCRegl 

PAEl_WRCReg2 

PAE1_BASE, CHECK&GO 
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PAE2_TriggerPortl 

PAE2^_TriggerPort2 /-"-" 

PAE2jfiRCRegl 

PAE2_WRCReg2 

PAE2_BASE, CHECK&GO 

PAEn_TriggerPortl 
PAEnJTriggerPort2 
PAEnJtfRCRegl 
PAEn_WRCReg2 
PAEnjBASE, CHECK&GO 
endSubConf 

11.1.2 Durchftthrung der WRC nach A2 
Fall II) 

Die Durchfiihrung einer WRC zwischen unterschiedlichen SubConf 
durch die CT entspricht prinzipiell Al/Il. Wesentlich ist, dafi 
die Triggerports und der CT-interne Ablauf dem FILMO-Prinzip 
entsprechen. KWs die von den PAEs zurttckgewiesen wurden (REJ) 
werden auf den FILMO geschrieben. Die Grundlagen sind aus 
PACT 10 bereits bekannt. 

SSmtliche WCP werden durch die CT ausgefiihrt, wodurch eine 
Deadlock freie (Re-) Konf iguration gewShrleistet 1st. 
Ebenso wird der Zeitpunkt der Rekonf iguration, der durch WCT 
gekennzeichnet ist an die CT geleitet und von der CT atomar 
behandelt, d.h. alle durch die Rekonf iguration betroffenen 
PAEs erhalten die Rekonf igurationsauf forderung durch WCT 
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entweder zeitgleich oder zumindest ohne Unterbrechung durch 
eihe andere Rekbnf igurationsauf f orderung, wodurch die 
Deadlock- Freiheit wiederum gewahrleistetist. 

Weiterftihrende Ausgestaltungen sind innerhalb dieser Schrift 
vorausgehend beschrieben. 

Fall 12) 

Entweder 

werden die WRCReg bereits wahrend der Konf iguration 
beschrieben und der WCP entfallt, da bereits die komplette 
SubConf in die jeweilige PAE geladen ist 
oder 

abhcLngig durch bestiromten WCP werden von der CT bestimmte 
WRC in unterschiedliche in der WRC definierte WRCReg 
geladen. Dies ist besonders dann notwendig, wenn ausgehend 
von einer SubConf durch auftretende WRT in mehrer 
unterschiedliche WRC verzweigt wird als physikalische WRCReg 
vorhanden sind. 

Es mufl verhindert werden, dafl irlehrere WCT zu unterschiedlichen 
Zeiten an unterschiedliche PAEs gefiihrt werden, da dadurch 
Deadlocks entstehen. Beispiel: WCT1 einer SubConf SA erreicht 
bei Takt tl die PAE pl f WCT 2 einer SubConf SB erreicht zu dem 
Zeitpunkt die PAE p2. Die PAEs werden entsprechend 
konfiguriert. Zum Zeitpunkt t2 erreicht WCT1 p2 und WCT2 pi. 
Ein Deadlock ist eingetreten. Es soli noch darauf hingewiesen 
werden, daB dieses Beispiel prinzipiell auch auf A2-I1 
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ahgewendet werden karin, weshalb dort WCT liber deh Triggerport 
der CT gefuhrt uhd von der :CT abgewickelt wird. 

Ein Deadlock wird auch verhindert, indent die von 
unterschiedlichen PAEs (Quelleh) generierten WCT von einer 
zentrale Instanz (ARB) derart priorisiert werden, daB zu einem 
Takt exakt ein WCT an die betreffende PAEs gesendet wird. 
Verschiedene Verfahren sind zur Priorisierung anwendbar, 
beispielhaft sollen einige genannt werden: 

a) Verwendung eines Arbiters nach dem Stand der Technik, 
insbesondere eignet sich der Round-Robin Arbiter nach 
PACT10. Die exakte zeitliche Reihenfolge des Auftretens 
der WCT geht dabei fiir gew5hnliche verloren. 

b) Sofern die zeitliche Reihenfolge eingehalten werden soli, 
bieten sich beispielsweise folgende Verfahren an: 

bl) Ein FIFO speichert zunSchst die eingehenden WCT 

entsprechend ihrer Reihenfolge. Zeitgleich eingehende WCT 
werden gemeinsam gespeichert, treten zu einem Zeitpunkt 
keine WCT auf, wird kein Eintrag erzeugt. Ein dem FIFO 
nachgeschalteter Arbiter waLhlt einen der Eintrage aus, 
sofern mehrere gleichzeitig auftraten. 

b2) Aus PACT 18 ist ein Verfahren bekannt, das eine 
zeitliche Sortierung von Ereignissen mittels einer 
zugeordneten Zeitinf ormation (Timestamp) erm5glicht. 
Durch Auswerten der Timestamp kann die zeitlich korrekte 
Abfolge der WCT sichergestellt werden . 
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Durch eine geeignete Weiterleitung der WCT von ARB an die 
betreffenderi PAEs wird sichergestelit, daB die priorisierten . 
WCT in der korrekten Reihenfolge bei den PAEs. ankoramen. Die . 
einfachste Mdglichkeit die Reihenfolge sicherzustellen ist, 
daB sSmtliche von ARB abgehenden Trigger zu den jeweiligen 
PAEs exakt dieselbe LSnge und Laufzeit aufweisen. Dies wird 
durch eine geeignete Programmierung oder ein geeignetes Layout 
durch einen Router sichergestelit, indent die Leitungsftihrung 
entsprechend abgeglichen wird und an den entsprechenden 
Punkten Register zum Abgleich der Latenz eingesetzt werden. 
Auch zur Sicherstellung der korrekten Weiterleitung kann das 
nach PACT 18 bekannte Verfahren zur zeitlichen Synchronisation 
von Informationen verwendet werden. 

Eine explizite Priorisierung der WCP ist nicht notwendig, da 
die an die CT gefiihrten WCP durch das FILMO-Prinzip innerhalb 
der CT wie bereits eriautert ordentlich abgearbeitet werden. 
Die Einhaltung der zeitlichen Reihenfolge kann gegebenenf alls 
insbesondere entsprechend des FILMO-Prinzipes (vgl. 2.1e) 
eingehalten werden. 

11.1.3 Anmerkung fttr samtliche Falle ' 
Die ftir die Wave-Rekonf iguratiori zusatzlichen 
Konfigurationsregister der PAEs verhalten sich entsprechend 
des FILMO-Prinzipes , d.h. die Register untersttttzen die 
beschriebenen Zustande und implementierten Ablaufe und 
reagieren entsprechend auf die Protokolle (z.B. CHECK/ACKREJ) - 
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11.2 Rekonf igur a tionsprotokolle und Aufbau der WRCReg 

An drei alternative Rekonf igurationsprotokollen soil das 
Verfahren der Wave Reconfiguration genauers erl&utert werden: 
Normal es CT-Protokoll : Die CT rekonf iguriert erst nach 
Eintreffen einer Rekonf igurationsanforderung jede PAE einzeln, 
wobei die CT fur jede PAE, die ChgPkt erreicht, eine 
Rekonf igurationsanforderung erhalt. Diese Methode ist 
ineffizient, da der Kommunikationsaufwand insbesondere fur 
gepipelinte Bussysteme sehr hoch ist. 

Synchronisierte Pipeline: Dieses Protokoll ist bereits 
wesentlich effizienter. Der gepipelinte CT-Bus wird als Puffer 
verwendet, indem das einer PAE zugeordnete Pipeline-Register, 
die KW dieser PAE so lange speichert, bis diese PAE die KW 
aufnehmen kann. Die CT-Bus Pipeline (CBP) wird damit zwar 
blockiert, kann aber komplett mit den KWs der Wave 
Rekonf iguration gefailt werden. 

a) Sofern die CBP in dieselbe Richtung wie die Datenpipeline 
verl3uft 7 gehen jeweils einige Takte Latenzzeit verloren f bis, 
nachdem eine PAE ein KW aufgenommen hat, das KW der direkt 
nachfolgenden PAE an deren Pipeline-Register eintrifft. 

b) Verlauft die CBP entgegen der Datenpipeline, kann die CBP 
komplett mit KW gefiillt werden, die bereits an der bestimmten 
PAE anstehen. Damit ist eine Wave-Rekonf iguration ohne 
zeitliche Verzogerung mGglich. 
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Synchronisiertes Schattenxegis ter (ef f izientestes Protokoll) : 
Die CT schreibt.sofort nach Auswahl. der : SubConf (i) vor 
Eintreffen von ChgPkt (ii) die neuen KWs in Schattenregister 
samtlicher PAEs. Die Schattenregister k6nnen in beliebiger 
Ausgestaltung implementiert sein. Folgende MSglichkeiten 
bieten sich z.B. besonders an: a) Vor die eigentlichen 
Konf igurationsregister geschaltete Registerstufe, b) 
paralleler Registersatz der fiber Multiplexer ausgewahlt wird, 
c) FIFb-Stufe vor den eigentlichen konf igurationsregis tern. Zu 
dem Zeitpunkt an dem ChgPkt (ii) bei einer PAE eintrifft, 
kopiert sie das Schattenregister in das entsprechende 
Konf igurationsregister . Das Kopieren geschieht im Optimalfall 
derart, dafi kein Arbeitstakt verloren geht. Sollte trotz 
Eintreffens von ChgPkt das Schattenregister nicht beschrieben 
sein (also leer) setzt die Datenverarbeitung bis zum 
Eintreffen der KW im Schattenregister aus. Bei Bedarf wird die 
Rekonfigurationsanforderung mit dem ChgPkt innerhalb einer 
Pipeline von einer PAE zu nachsten weitergeleitet . 

12. Formen der Parallelitat und sequentielle Bearbeitung 

Durch eine hinreichend hohe Rekonf igurationsperformance lassen 
sich sequent ielle Rechenmodelle in Arrays abbilden, indem die. 
Low-Levei-CTS quasi einen konventionellen Codef etcher 
darstellen und das Array als VLIW-ALU mit 
mikroprogrammierbarer Vernetzung arbeiten. 
Weiterhin lassen sich samtliche Formen der Parallelitat in 
Arrays aus Rechenelementen abbilden: 
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Pipelining: Pipelines lassen sich durch in Reihe geschaltete 
PAEs aufbauen. Die VPU^gem&Beh Prdtokolle erlauben die 
einfache Steuerung der Pipeline. 

Instruction Level Parallelitat: Parallele Datenpfade sind 
durch parallel geschaltete PAEs aufbaubar. Die VPU-gemMfcen 
Protokolle und besonders die Triggersignale erlauben die 
einfache Steuerung. 

SMP, Multitasking und Multiuser: Durch die Deadlockf reiheit 
der Konf igurationsverfahren kSnnen unabhangige Tasks 
automatisch parallel in einem PA ausgefiihrt werden. 

Bei ausreichender Anzahl von PAEs k6nnen auch alle 
wesentlichen Teile konventioneller Mikroprozessoren auf das -R 
konfiguriert werden. Dann kann eine sequentielle Bearbeitung 
einer Aufgabe auch ohne CT erfolgen. Diese mufi erst wieder 
aktiv werden, wenn der konf igurierte Prozessor eine teilweise 
andere Funktionalitat, beispielsweise in der ALU, erhalten 
Oder komplett ersetzt werden soli. 

13. Ausfiihmngsbeispiele und Diagraming 

In den Figuren 1-3 ist der bespielhafte Aufbau einer SubConf 
dargestellt. CW-PAE kennzeichnet die Nummer eines KWs 
innerhalb einer PAE mit der Adresse PAE (z.B. 2-3 ist das 2.KW 
fur die PAE mit der Adresse 3) . Weiterhin sind die Flags 
dargestellt (C=Check, D=Dif ferential, G=Go) , ein gesetztes 
Flag ist mit „*" gekennzeichnet . 
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In Figur 1 ist der einfachste lineare Aufbau einer SubConf, 
wie er z.B. gemafl PACT10 tiblich ist dargestellt. Eine PAE wird 
wahrend der. ersten Konfiguration getestet (C), dann 
weiterkonfiguriert (D) und abschlieBend gestartet (G) (siehe 
PAE mit Adresse 0) . Auch der gleichzeitige Test und Start ist 
mfiglich (CG, siehe PAE mit Adresse l f 0101). 

In Figur 2 ist eine darart umsortierte SubConf dargestellt, 
daB eine Barrier (0201) eingeftihrt wurde. Vor der Barrier 
miissen alle PAEs getestet werden. Die Barrier wartet dann bis 
zum Eingang aller ACKs oder REJs. Sofern kein RE J auftritt 
wird die Barrier tibersprungen, die dif ferentiellen 
Konf igurationen werden durchgefuhrt und die PAEs werden 
gestartet. Bei Auftreten eines REJ wird die Barrier nicht 
tibersprungen, statt dessen werden FILMO-Laufe ausgeftihrt, bis 
kein REJ mehr auftrat, danach wird Barrier tibersprungen. 
Vor der Barrier muB jede PAE getestet und erst danach dtirfen 
die PAEs dif ferentiell konfiguriert und gestartet werden. 
Sofern Test und Start ursprtinglich im selben Zyklus stattfand, 
muB das KW jetzt getrennt werden (0101 -> 0202, 0203) . 

In Fxgur 3 wird eine SubConf derart umsortiert, daB keine 
Barrier notwendig ist, v statt dessen eine Latenzzeit zwischen 
Check und dem Eintreffen von ACK/REJ eingeftigt wird, wahrend 
der kein weiterer Check durchgefuhrt werden darf • Dazu werden 
die KWs zu Atomen (0301) zusammengefaBt, wobei das erste KW 
eines Atoms einen Check durchftihrt (0302) und der Block dann 
mit differentiellen KWs oder ggf . NOPs (0303) bis zum Ablauf 
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der Latenzzeit gefttllt wird . Die Arizahi def dif f erentielleri 
KWs hangt von der latenzzeit ab. Aus Darstellungsgrttnden wurde 
exemplarisch eine Latenzzeit yon 3 Takten gewahlt. Bei .0304 
trif f t ACK/REJ ein, wbraufhin entschieden wird, ob die 
Konfiguration mit dem nachsten KW, das einen Check enthalten 
kann (nicht unbedingt muB) weitergeftihrt (0305) wird, oder 
aufgrund eines REJs zur Wahrung der Reihenfolge abgebrochen 
wird. ... 

Wesentlich ist, daB bei der Konfiguration einer PAE X zunachst 
Check duirchgefiihrt wird, ; dann auf das Eintreffen von ACK/REJ 
gewartet wird - wahrend dieser Zeit kann eine bereits 
gecheckte PAE weiterkonfiguriert werden, oder es miissen NOPs 
eingefiihrt werden. Erst dann kann PAE X weiterkonfiguriert 
werden. Beispiel: Check der PAE (0302), Fortsetzung der 
Konfiguration (0306) . Bei 0307 mttssen NOPs nach einem Check 
eingefiihrt werden, da keine dif f erentiellen Konf igurationen 
zur Verftigung stehen. 0308 zeigt das Aufteilen von 
Konf igurationen iiber mehrere Blocke (hier 3) hinweg, wobei ein 
Check ausgelassen wird (0309) . 

Fxgux 4 zeigt eine mOgliche Statema chine zur Realisierung der 
PAE Zustande. Der Grundzustand ist IDLE (0401). Durch 
Konf igurieren des Flags Check (0405) geht die Statemachihe in 
den Zustand „alloziiert n (0402). Konfigurieren des Flags LAST 
(0409, 0408) startet die PAE f der Zustand ist „konf iguriert^ 
(0404). Durch LocalReset (0407) geht die PAE in den Zustand 
„unkonfiguriert" (0403) . In diesem Ausfiihrungsbeispiel geht 
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die PAE erst nach Abfrage ihres Status durch LOCK/FREE (0406) 
nach IDLE zurticic. 

LocalReset und LAST konnen auch von der CT durch einen 
Broadcast versendet werden, siehe ModulID. 

Die Figuren 5-9 zeigen mogliche Implementierungen der FILMO- 
Verfahren gemafi Abschnitt 5. Dabei werden lediglich die 
relevanten Baugriippen die als Interface zum PA dienen 
dargestellt. Schnittstellen zur CT werden nicht beschrieben. 
Diese sind weitgehend entsprechend dem Stand der Technik 
(PACT10) implementierbar und bedtirfen gegebenenfalls nur 
geringer Modifikationen. 

Figux 5 zeigt den Aufbau einer CT-Interf aces zum PA bei 
Verwendung einer STATELUT nach 5.1. Eine CT 0501 mit RAM und 
integriertem FILMO (0502) wird abstrahiert dargestellt und 
soli nicht nSher eriautert werden, da die Funktion durch 
PACT10 und PACT 05 nach dem Stand der Technik ausreichend 
bekannt ist. Die CT fragt den Status des PA (0503) durch 
Setzen des Signals LOCK (0504) ab, woraufhin jede PAE deren 
Status sich seit dem letzten LOCK geSndert hat, diese Anderung 
an die STATELUT (0505) weiterleitet (0506). Diese 
Weiterleitung geschieht derart, daB die STATELUT eindeutig 
jeder PAE ihren Status zuordnen kann. Dazu stehen mehrere 
Verfahren nach dem Stand der Technik zur Verftigung, 
beispielsweise kann jede PAE ihre Adresse zusammen mit dem 
Status an die STATELUT senden, die far jede PAE unter deren 
Adresse deren Status speichert. 
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Die CT schreibt KWs (0510) zunachst in ein Register (0507) . 
Gleichzextig wird ein Lookup unter der Adresse (#) der das 
jeweilige KW betref f ende , PAE in der STATELUT (0505) 
durchgef tthrt . 1st der Status der PAE „unkonf iguriert", erhait 
die CT ein ACK (0509), ansonsten ein RE J. Ein einfacher 
Protokollkonverter (0508) wandelt ein ACK in ein RDY, urn das 
KW in das PA zu schreiben, REJ wird in notRDY konvertiert, um 
das Schreiben in das PA zu verhindern. 

Es soil noch angemerkt werden, da& die Weiterleitung von LOCK, 
RDY und KW zum PA und im PA, ebenso wie die Riickmeldung des 
Status der PAEs vom PA gepipelinet r d.h. durch Register 
verlauft. 

In Figur 6 ist das Verfahren nach 5.2 beispielhaft ausgeftihrt. 
Der technische Aufwand ist verhaltnismafiig gering. Eine CT 
(0601) mit integriertem FILMO (0602) ist derart modifiziert, 
dafi nur ftir das erste an das PA (0603) gesendete KW (0604) 
eines Atoms eine Quittung (0605) (ACK/REJ) erwartet wird. Die 
Quittung wird beira letzten KW eines Atoms ausgewertet. Bei ACK 
wird die Konfiguration mit dem nachsten Atom fortgesetzt, REJ 
bewirkt den Abbruch der Konfiguration der SubConf. 

Figux 7 zeigt den Aufbau eines FILMOs (0701) nach 5.3. Dem 
FILMO ist der RELJMP-Speicher zugeordnet (0702), wobei jeder 
Eintrag ira RELJMP einem FILMO-Eintrag zugeordnet ist. Der 
_FILMO ist dabei als integrierter FILMO gemSB PACT10 
ausgestaltet, sodafi RELJMP eine verkettete Liste auf zu 
konfigurierende KWs darstellt. Zudem soil besonders darauf 
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hingewiesen werden, dafi in diesem Fall der FILMO auch CT- 
Befehle und Verkettungen derer gemifi PACT10 enttiaiten kanri. 
Die verkettete Liste in RELJMP wird wie folgt generiert: 
Der Lesezeiger (0703) zeigt auf das KW, das aktuell 
konfiguriert wird. In 0704 ist die Adresse des KWs 
gespeichert, das zuletzt zurftckgewiesen (REJ) wurde. Sofern 
das aktuell konfigurierte KW (0706) vom PA (0707) akzeptiert 
wird (ACK, 0708) , wird der, in 0702 an der Adresse auf die 
0703 zeigt gespeicherte, Wert zu 0703 dazuaddiert. Dadurch 
ergibt sich ein relativer Sprung. 

Wird dagegen das aktuell konfigurierte KW zurtickgewiesen (REJ> 
0708) wird zunachst die Differenz aus 0703 und 0704, die 
mittels eines Subtrahierers (0705) berechnet wird, in RelJmp 
gespeichert, und zwar an der Adresse des zuletzt 
zurtickgewiesenen KW, die in 0704 gespeichert ist. In 0704 wird 
der aktuelle Wert von 0703 gespeichert. Danach wird der, in 

0702 an der Adresse auf die 0703 zeigt gespeicherte, Wert zu 

0703 dazuaddiert. Dadurch ergibt sich ein relativer Sprung. 
Die Steuerung iibernimmt eine Zustandsmaschine (0709), deren 
Impleiuentierung gemaB des beschriebenen Ablaufes erfolgt. Ober 
einen Multiplexer (0710) wird die Adresse fur den RelJmp durch 
0709 je nach Operation bestimmt, indem zwischen 0703 und 0704 
ausgewahlt wird. Urn 0701 und 0702 effizient gleichzeitig 
unterschiedlich adressieren zu konnen, ist sinnvoll bei der 
Implementierung 0702 physikalisch von 0701 zu trennen f urn zwei 
getrennt Speicher zu erhalten, die getrennt adressiert werden 
konnen . 
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0711 zeigt die Funktiohsweise der relativen Adressierung. Die 
Adresse die auf einen Eintrag im RelJmp zeigt zum Inhalt von 
RelJmp dazuaddiert und= ergibt die Adresse.. des nachsten . 
Eintrages . 

Figur 8 zeigt eine mSgliche Implementierung des Verfahrens 
nach 5.3 mit modifiziertem Garbage Collector. Die EintrSge im 
FILMO (0801) werden linear verwaltet, wodurch RelJmp nicht 
benotigt wird. 0801 ist als separater FILMO implementiert . 
Durch einen Lesezeiger (0804) werden die KWs (0803) 
adressiert, die in das PA (0802) geschrieben werden. S&mtliche 
KWs werden in der Reihenfolge ihrer Konfiguration in einen 
FIFO oder FIFO-ahnlichen Speicher (0805), der beispielsweise 
auch als Schieberegister ausgestaltet sein kann, geschrieben. 
Der Speicher ist exakt so tief , wie Takte vom Absenden eines 
KWs an das PA, bis zum Eintreffen der Quittierung (RDY/ACK, 
0806) vergehen. 

• Bei Eintreffen eines REJ wird das dem REJ zugewiesene 
zurttckgewiesene KW, das sich zu diesem Zeitpunkt am 
Ausgang des FIFOs befindet in 0801 geschrieben. REJ wird 
dazu als Schreib-Signal ftir den FILMO verwendet (REJ- 
>WR) . Die Schreibadresse wird durch einen Schreibzeiger 

. (0807) v generiert, der nach dem Schreibzugrif f 
inkrementiert wird. 

• Bei Eintreffen eines ACK geschieht nichts, das dem ACK 
zugewiesene konfigurierte KW wird ignoriert, 0807 bleibt 
unverandert. 
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Dadurch entsteht eine neue lineare Folge aus zurttckgewiesenen 
KWs im FILMO. Die implement ierung des FILMOs ais Dual-Ported- 
RAM mit getrenntem Schreib- und Leseport wird.aus Performance- 
Grtinden yorgeschlagen. 

Figur 9 zeigt eine Implementierung des Verfahrens nach 5.4. 
Dabei wird ersichtlich, dafi es sich dabei um eine Abwandlung 
des Verfahrens nach 5.3 handelt. 

Durch einen Lesezeiger (0909) wird das in das PA (0901) zu 
schreibende KW (0902) im FILMO (0910) adressiert. Die Adresse 
und Flags (0902a) der zu konf igurierenden PAE von 0902 wird 
zunSchst testweise an das PA gesendet. Das KW mit der Adresse 
der zu konf igurierenden PAE wird in einen FIFO-ahnlichen 
Speicher (0903, entsprechend 0805) geschrieben. 0902a wird 
gepipelinet in das PA Obertragen. In der adressierten PAE wird 
der Zugriff ausgewertet und quittiert. Die Quittung (RDY/ACK) 
wird ebenfalls gepipelinet zurttckgesendet (0904). 0903 
verz6gert genausolang, wie Takte vom Absenden von 0902a an das 
PA, bis zum Eintreffen der Quittierung (RDY/ACK, 0904) 
vergehen. 

• Sofern mit ACK quittiert wurde, wird das komplette KW 
(0905) (Adresse + Daten) am Ausgang von 0903 das der. 
entsprechenden Quittung zugeordnet ist, gepipelinet an 
das PA gesendet (0906) . Eine Quittung dafQr wird nicht 
erwartet, da bereits bekannt ist, daB die adressierte PAE 
das KW akzeptiert. 
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• Bei REJ wird das KW in den FILMO zuruckgeschrieben 

(0907) . Dazu wird ein Schreibzeiger (0908) yerweridet der 
0807 entspricht.. Der Zeiger wird dabei inkrementiert.. 
0904 wird dabei mittels eines einfachen Protokollkonverters 
(0911) (i) bei ACK in ein Schreibsignal far das PA (RDY) und 
(ii) bei REJ in ein Schreibsignal 0901 fur den FILMO (WR) 
umgewandelt . 

Es entsteht eine heue lineare Folge aus zuriickgewieseneh KWs 
im FILMO. Die Implementierung des FILMOs als Dual-Ported-RAM 
mit getrenntem Schreib- und Leseport wird aus Performance- 
Grilnden vorgeschlagen. 

Pigxir 10 zeigt ein Ausfiihrungsbeispiel fiir das • 
erfindungsgemafie Inter-CT-Protokoll. 4 Ebenen von CT sind 
dargestellt. Die RootCT (1001), CTs von 2 Zwischenebenen 
(1002a-b und 1003a-d) , die Low-Level-CTs (1004a-h) und deren 
FILMOs (1005a-h). Im 1004e zugeordneten PA wird ein Trigger 
generiert, der innerhalb von 1004e auf keine lokale SubConf 
iibersetzt werden kann, sondern einer EnhSubConf zugeordnet 
ist. 1004e sendet an 1003c einen REQUEST far diese EnhSubConf. 
1003c hat die IDChain nicht gecached. Die EnhSubConf wird 
nSmlich partiell auch auf 1004g ausgefQhrt, die kein Blatt von 
1003c ist. Somit leitet 1003c den REQUEST an 1002b weiter, 
Durch die Schraffur wird angezeigt, dafi 1002b die IDChain 
gecached haben k6nnte f da 1004g ein Blatt von 1002b ist. 
Angenoramen 1002b hat jedoch IDChain noch nicht gecached und 
fordert diese daher bei 1001 an. 1001 lad die IDChain aus dem 
CTR (vgl. PACT10) und sendet sie an 1002b. Der Vorgang wird 
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nachfolgend als GRANT bezeichnet. 1002b cached die IDChain, da 
samtliche beteiiigten CT Blatter von 1002b sind. banach sendet 
1002b atoraar, also ohne Unterbrechung durch einen anderen 
GRANT, den GRANT an 1003c und 1003d. Dabei wird die IDChain 
gesplittet und an zwei verschiedene CTs gesendet, wodurch 
keiner der Empf anger ein gemeinsamer Verwalter aller Blatter 
sein kann. Das Flag Split wird gesetzt, die Empf anger und alle 
tieferen CTs k6nnen die IDChain nicht mehr cachen. 1003c und 
1003d senden wiederum atomar den GRANT an die Low-Level-CTs 
1004f bzw. 1004g. Die Low-Level-CTs speichern direkt den 
eingehenden GRANT in einer entsprechenden, die Reihenfolge der 
zu konfigurierenden SubConf kennzeichnenden Liste, die 
bespielsweise separat ausgestaltet sein kann oder durch die 
direkte DurchfUhrung der Konf iguration mit einer 
gegebenenfalls stattfindenden Eintragung zuriickgewiesener. KWs 
in den FILMO entstehen kann. 

Ftir die Low-Level-CTs ergeben sich zwei , Varianten: 

• Entweder sie haben die zu startende der ID gemafl IDChain 
entspechende SubConf bereits gecached, dann wird die 
Konf iguration sofort gestartet. 

• Oder sie haben die der ID gemaB IDChain entsprechende 
SubConf noch nicht gecached, dann miissen sie diese erst 
bei den (lbergeordneten CTs anfordern. Die Anforderung 
(GET) ist in Figur 11 verdeutlicht, wobei wiederum davon 
ausgegangen wird, dafi keine der CTs aus den 
Zwischenebenen die SubConf gecached hat. Die jeweilige 
SubConf wird daher von der RootCT aus dem CTR geladen und 
an die Low-Level-CTs gesendet (DOWNLOAD) . Der Ablauf ist 
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prihzipieli aus PACT10 bekannt urid soil datier nicht haher 

aiisgefQhrt werden. 
. In jedem Fall ist jedoch wesentlich, daB nach Eintreffen eines 
GRANT dieser vor jedem weiteren GRANT ausgeftihrt wird. Trifft 
GRANT A vor GRANT B ein, so muB GRANT A vor GRANT B 
konfiguriert werden. Dies gilt auch dann, wenn die SubConf von 
GRANT A erst geladen werden muB, wahrend die SubConf von GRANT 
B in der Low-Level-CT gecached ware und sof ort gestartet 
werden k6nnte. Die Reihenfolge der eingehenden GRANTS muB 
eingehalten werden, da ansonsten ein Deadlock unter den 
EnhSubConf auf treten kann . 

In einer besonderen Ausgestaltung des beschriebenen Verfahrens 
konnen CTs des CTTREEs direkt auf Konfigurationen, ohne 
Einbeziehung der dartiberliegenden CTs, zugreifen, indem sie 
eine Verbindung zu einem beleibig ausgestalteten, f liichtigen 
oder nicht flttchtigen Speicher oder Massenspeicher besitzen. 
Dieser Speicher kann zum Beispiel ein SRAM, DRAM, ROM, Flash, 
CDROM, Festplatte oder Serversystem sein, das ggf . auch 
mittels Netzwerk (WAN, LAN, Internet) angebunden ist. Es soil 
ausdriicklich erwahnt sein, daB also auch der direkte Zugriff 
einer CT unter Umgehung der dartiberliegenden CTs auf einen 
Speicher ftlr Konf igurationsdaten moglich ist. Auch in einem 
derartigen Fall findet die Synchronisation der Konf iguration 
innerhalb des CTTREE, insbesondere bei EnhSubConf , unter 
Einbeziehung der dartiberliegenden CTs statt. 

Figur 12 zeigt drei Beispiele (Figur 12a-12c) . Dargestellt ist 
der Konfigurationsstack von 8 CTs (1201-1208). Der 
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Konfigurationsstack 1st die Liste der zu konfigurierenderi 
SubConf .Die. SubConf werden in derselberi Reihenfolge 
kpnfiguriertf wie sie in der Liste eingetragen sind. Ein 
Konfigurationsstack wird beispielsweise durch die Verkettung 
einzelner SubConf gebildet, wie dies in PACT10 Figur 26-28 
beschrieben ist. Eine andere M6glichkeit ist eine einfache 
Liste von IDs die auf die SubConf zeigen, wie in Figur 12. 
Dntere Einrfige werden zuerst, Hohere zuletzt konfiguriert. 
In Figur 12a sind zwei EnhSubConf (1210, 1211) dargestellt, 
die korrekt im Konfigurationsstack der einzelnen CTs liegen. 
Die einzelnen SubConf der EnhSubConf werden in der richtigen 
Reihenfolge deadlockfrei konfiguriert. Die Reihenfolge der 
GRANTS wurde beachtet. 

Auch das Beispiel in Figur 12b ist korrekt. Drei EnhSubConf 
sind dargestellt (1220, 1221> 1222) . 1220 ist eine grofie 
EnhSubConf die alle CTs betrifft. 1221 betrifft nur die CTs 
1202-1206, eine weitere betrifft die CTs 1207 und 1208. 
Samtliche SubConf werden deadlockfrei in der richtigen 
Reihenfolge konfiguriert. Der GRANT ftir 1222 wurde vollstandig 
vor dem GRANT fQr 1220 abgearbeitet und dieser vor dem GRANT 
far 1221. 

Das Beispiel Figur 12c zeigt mehrere Deadlock-Situationen. In 
1208 wurde die Reihenfolge der GRANTS von 1230 und 1232 
vertauscht. Folge ist, daB in dem 1208 zugeordneten PA 
Resourcen ftir 1230 belegt werden und in dem 1208 zugeordenten 
PA Resourcen far 1232. Die Respurcen sind jeweils fest 
alloziiert. Dadurch entsteht ein Deadlock, da keine EnhSubConf 
ausgeftihrt oder zuende konfiguriert werden kann. 
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Ebenfalls sind in den CTs 1204 und 1205 die GRANTS von 1230 
und 1231 zeitlich vertauscht. Dadurch eritsteht aus denselben 
Grtlnden ebenfalls ein Deadlock. 

In Figur 13a ist eine Performance optimierte Version der 
Inter-CT-Kommunikation dargestellt. Dabei wird ein Download 
direkt zur Low-Level-CT durchgeftihrt, d.h. CTs der mittleren 
Ebenen mtissen nicht ziierst die SubConf empfangen, speichern 
und dann weiterleiten. Vielmehr „hdren" diese CTs lediglich 
mit (1301, 1302, 1303, LISTENER) und cachen die SubConf. 
Deir schematische Busaufbau ist in Figur 13b dargestellt. Ein 
Bypass (1304, 1305, 1306), normalerweise in Form eines 
Registers, fiihrt den Download an den CTs der mittleren Ebenen 
vorbei . 

Figur 14 zeigt den m6glichen Aufbau einer Schaltung zwischen 
CT und PA, zur einfachen Konf iguration von SubConf Makros. Ein 
KW wird uber den Bus (1401) von der CT tibertragen. Das KW wird 
in seine Konfigurationsdaten (1402), sowie die PAE Adressen X 
(1403) und Y (1404) zerlegt (bei mehrdimensionaler 
Adressierung sind entsprechend mehr Adressen zu zerlegen) . 
1405 addiert einen X-Offset zur X-Adresse und 1406 einen Y~ 
Offset zur Y-Adresse. Die Offsets k6nnen unterschiedlich sein 
und sind in einem Register (1407) gespeichert. Der 
parametrisierbare Teil der Daten (1408) wird als Adresse auf 
eine Lookup-Tabelle (1409) geleitet, in welcher die 
tatsachlichen Werte gespeichert sind. Die Werte werden iiber 
mit den nicht parametriesierbaren Daten (1412) verkntipft 



91 



WO 02/13000 



PCT/EP01/06703 



(1410) . Ober einen Multiplexer (1413) ist selektierbar ob ein 
^/i^bkup'durchgeftlhrt werden soil oder 6b die Daten direkt, ohhe 
Lookup yerwendet werden sollen. Die Auswahl wird mittels eines 
Bits (1411) durchgef tthrt . samtliche Adressen und die Daten 
werden wieder verkniipft und als Bus (1413)- an das PA geftihrt. 
Je nach Implementierung ist der FILMO. der beschriebenen 
Schaltung vor- oder nachgeschaltet; integrierte FILMOs werden 
vorgeschaltet, separate FILMOs nachgeschaltet. Ober den Bus 
1415 setzt die CT die Adressof f sets und die 

ParameterUbersetzung in 1409. 1409 kann der Einfachheit halber 

als Dual-Ported-RAM ausgestaltet sein. 

Der Aufbau eines entsprechenden KW ist wie folgt: 



X-Adresse 


Y~Adresse 


Daten 


Adresse 
fiir 1409 


MUX = 1 


X-Adresse 


Y-Adresse 


Daten 


Daten 


MUX = 0 



Ist MUX = 1, wird ein Lookup in 1409 durchgef tihrt, bei MUX = 0 
werden die Daten direkt an 1414 weitergeleitet. 

In Figur 15 ist die AusfOhrung eines Graphen verbildlicht . Die 
jeweils nSchsten m5glichen Knoten (1..13) des Graphen werden 
vorgeladen (prefetch), entsprech end werden vorhergehende 
Knoten und nicht genutzt Sprtinge geldscht (delete) . Innerhalb 
einer Schleife werden die IQnoten der Schleife nicht gel6scht 
(10,11,12), die entsprechenden Knoten werden erst nach 
Beendigung entfernt. Knoten werden nur geladen, wenn sie sich 
nicht bereits im Speicher der CT befinden. Ein mehrfaches 
Abarbeiten von (z.B.) 11 f tthrt daher nicht zum mehrfachen 
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laden von 12 oder 10. „delete 8,9" wird in 11 ignoriert, 
soferh 8 und oder 9 bereits entferrit warden. 

Figur 16 schematisiert die mehrfache Instantiierung eiries 
SubConf Makros (1601). Verschiedene SubConf (1602, 1603, 1604) 
rufen 1601 auf . Die Parameter ftir 1601 werden von der jeweils 
aufrufenden SubConf in einer Lookup Tabelle (1605) vorgeladen 
(1610). 1605 ist nur einmal implement iert, in Figur 16 jedoch 
raehrfach gezeichnet, urn die verschiedenen Inhalte zu 
symbolisieren . 

1601 wird aufgerufen. Die KWs werden an 1605, 1606 und 1607 

iibertragen. Diese Elemente arbeiten wie folgt: 

Basierend auf einem Lookup wird der entsprechende Inhalt von 

1605 mit dem KWs wieder verkniipft (1606) . Nach dem Multiplexer 

1413 (1607) , der auswMhlt ob das originale KW gtiltig ist oder 

ein Lookup durchgefiihrt wurde, wird das KW an das PA gesendet 

(1608). 

Figur 17 zeigt schematisch den Ablauf einer Wave 
Rekonfiguration. Einfach schraffierte FlSchen stellen 
datenverarbeitende PAEs dar f wobei 1701 PAEs nach der 
Umkonfiguration und 1703 PAEs vbr der Umkonfiguration zeigen. 
Doppelt schraffierte Flachen (1702) zeigen PAEs die gerade 
umkonfiguriert werden oder auf die Umkonfiguration warten. 
Figur 17a zeigt den EinfluB der Wave-Rekonf igurierung auf 
einen einfachen sequentiellen Algorithmus. Hier ist es 
mdglich, exakt die PAEs umzukonfigurieren, denen eine neue 
Aufgabe zugeteilt wird. Da in jedem Takt eine PAE eine neue 
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Aufgabe erhkit karih dies effizient, namlich zeitgleich 
durchgef tihrt werden . 

Beispielsweise dargestellt ist eine. Reihe von PAEs aus der 
Matrix aller PAEs einer VPU. Angegeben sind die ZustSnde in 
den Takten nach Takt t mit jeweils einem Takt VerzGgerung. 

In Figur 17b ist die zeitliche Auswirkung der Umkonf iguration 
von grofien Teilen dargestellt. Beispielsweise dargestellt ist 
eine Menge von PAEs einer VPU. Angegeben sind die ZustSnde in 
den Takten nach Takt t mit einer unterschiedlichen VerzSgerung 
von jeweils mehreren Takten. 

WMhrend zunSchst nur ein kleiner Teil der PAEs umkonf iguriert 
wird oder auf die Umkonf iguration wartet, wird diese Fiache 
mit zunehmender Zeit grSfier, bis alle PAEs umkonf iguriert 
sind. Das grSBer werden der FlSche bedeutet, daB, bedingt 
durch die zeitliche Verzogerung der Umkonf iguration immer mehr 
PAEs auf die Umkonf iguration warten (1702). Dadurch geht 
Rechenleistung verloren. 

Es wird daher vorgeschlagen ein breiteres Bussystem zwischen 
der CT (insbesondere des Speichers der CT) und den PAEs 
einzusetzen, das gentigend Leitungen zur Verftigung stellt, iam 
innerhalb eines Taktes mehrere PAEs zugleich 
umzukonf igurieren . 
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Figur 18 zeigt beispielhaf t unterschiedliche 
Konfigurationsstrategien far ein Rekonfigurationsverfahren 
ahnlich den „Synchronisierte Schattenregister" nach 11.2. 
Abgebildet ist dabei jeweils schematisch die CT (1801) , sowie 
eine von mehreren PAEs (1804) , wobei innerhalb der PAE jeweils 
nur die Konf igurationsregis.ter (1802, 1803) abgebildet sind, 
sowie eine Einheit zur Auswahl der aktiven Konfiguration 
(1805) . Weitere Funktionseinheiten innerhalb der PAE wurden 
aus Grtinden der Obersichtlichkeit nicht dargestellt. Die CT 
besitzt jeweils n SubConf (1820), wobei in den Fallen -II 
jeweils die entsprechenden KW einer SubConf bei einem 
auftretenden WCP geladen wird (l(n)) und in den Fallen -12 die 
KW von m SubConf aus der Gesamtmenge von n geladen • werden 
(m(n)). Die unterschiedliche Anbindung von WCT (1806) und WCP 
(1807) ist dargestellt, ebenso wie die optionalen WCP (1808) 
wie nachfolgend beschrieben. 

In Al-Il wird innerhalb derselben SubConf durch einen ersten 
Trigger WCP eine nachste Konfiguration ausgewahlt, die 
dieselben Ressourcen nutzt oder deren Ressourcen zumindest 
bereits vorreserviert und durch keine andere aufcer eventuell 
der WCP generierenden SubConf belegt sind. Durch die CT (1801) 
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wird die konfiguration geladen. In dem hieir gezeigten Beispiel 
wird die Kdnfi^ratibn nicHt direkt ausgeftihrt, sondern in 
eines von mehreren alternativen Register (1802) geladen. Durch 
einen zweiten Trigger WCT wird exakt zum Zeitpunkt der 
erforderlichen Rekonf iguration eines der alternativen Register 
derart ausgewahlt, dafi das zuvor aufgrund von WCP geladene 
Konfiguration ausgeftthrt wird. 

Grundsatzlich wird durch WCP eine bestimmte Konfiguration 
bestimmt und vorgeladen und durch WCT der Zeitpunkt der 
tatsachlichen der vorgeladenen Rekonf iguration entsprechenden 
Funktionsanderung bestimmt. 

Sowohl WCP als auch WCT kann ein Vektor sein, sodafl durch 
WCP(vi) eine von mehreren Konf igurationen vorgeladen wird, 
wobei durch die Quelle von WCP die vorzuladende Konfiguration 
spezifiziert wird. WCT(v 2 ) wahlt entsprechend eine von 
mehreren vorgeladenen Konf igurationen aus. In diesem Fall ist 
eine der Menge der durch v2 wahlbaren Konf igurationen 
entsprechende Anzahl von 1802 erforderlich, wobei ftir 
gewohnlich die Anzahl fest vorgegeben ist f sodaB v2 der 
maximalen Menge entspricht. 

Ausgehend davon ist in A1-I2 eine Version mit einem 
Registersatz 1803 mit einer Vielzahl von 1802 dargestellt. Im 
optimalen Fall ist die Anzahl der Register in 1803 derart 
grofl, dafl s^mtliche m5glichen jeweils folgenden 
Konfigurationen direkt vorgeladen werden konnen, wodurch WCP 
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eritf alien kann, sodafi lediglich der Zeitpunkt des 
Fuhktionswechsels . sowie der Wechsel seibst durch WCT (v 2 ) 
spezifiert wird.. . . 

A2-I1 zeigt die WRC derart, daft eine nachste Konf iguration 
ausgewahlt wird, die nicht dieselben Ressourcen nutzt oder 
deren Ressourcen nicht vorreserviert oder durch eine andere 
aiiBer eventuell der WCP{vx) generierenden SubConf belegt sind. 
Die Deadlockfreiheit der Konf iguration wird durch die FILMO- 
konforme Reaktion und Konf iguration auf WCP(v x ) gewShrleistet . 
Das Starten von Konf igurationen durch WCT (V2) (1806) wird 
ebenfalls von der CT durch die FILMO-konforme atomare Reaktion 
auf das Eintref f en von Triggern (ReconfReq) , die einen 
Rekonfigurationszeitpunkt kennzeichnen, atomar durchgeftihrt . 

In A2-I2 werden samtliche nachf olgenden SubConf entweder 
bereits beim ersten Laden einer SubConf in die 
Konfigurationsregister 1803 vorgeladen, oder bedarf sweise, 
sofern die Anzahl der Konfigurationsregister nicht ausreicht, 
durch die CT mittels der bekannten Abwicklung eines 
auftretenden WCP(vi) nachgeladen. 
Die Trigger (ReconfReq, 1809) , die einen 
Rekonfigurationszeitpunkt bestimmen und die eigentliche . 
Rekonfiguration auslosen werden zunachst iiber einen geeigneten 
Priorisierer (1810) zeitlich derart entkoppelt und als WCT(v 2 ) 
an die PAEs geleitet, daft immer nur exakt ein WCT(v 2 ) zu einem 
Zeitpunkt an einer PAE aktiv ist und die Reihenfolge der 
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eintreffenden WCT(v 2 ) bei alien betreff enden PAEs dieseibe 

ist; ; - ■ - ' : " - ' : - • • • 

Bei A2-I1 und A2-I2 ward in diesen Ausfiihrungsbeispielen ein 
zusatzliches Triggersystem verwendet. Sowohl bei der 
Abarbeitung von WCT durch 1801, also auch bei einer 
Abarbeitung durch 1810 kann eine erhebliche Verzogerung bis 
zur Weiterleitung an 1804 auftreten. Es ist jedoch wesentlich, 
daB der Zeitpunkt ChgPkt zeitlich exakt eingehalten wird, da 
die PAEs ansonsten die nachfolgenden Daten falsch verarbeiten 
wtlrden. Daher wird ein weiterer Trigger (1811, WCS = 
WaveConfigurationStop) verwendet, der lediglich die 
Datenverarbeitung der PAEs solange stoppt, bis durch das 
Eintreffen des WCT die neue Konf iguration aktiviert ist. WCS 
wird fur gewohnlich innerhalb der gerade aktiven SubConf 
generiert. In vielen Fallen kann ReconfReq und WCS identisch 
sein, da sofern ReconfReq innerhalb der gerade aktiven SubConf 
generiert wird, dieses Signal zumeist auch das Erreichen von 
ChgPkt kennzeichnet. 

Figur 19 zeigt eine Implementierungsvariante von A1-I2 und A2- 
12, wobei statt eines Registersatzes ein FIFO-Speicher (1901) 
zur Verwaltung der KW verwendet wird. Dabei ist die durch WCP 
vorgegebene Reihenfolge der SubConf fest. Durch das Auftreten 
von WCT (bzw. WCS, alternativ durch 1902 dargestellt) kann 
lediglich die nachste Konfiguration aus dem FIFO geladen 
werden. Die wesentliche Funktion von WCS, also das Anhalten 
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der laufendeh batenverarbeiturig ist exakt dieselbe wie in 
Figur 18 beschrieben. ,. 

In Figur 20 ist ein Abschnitt einer Zeile von PAEs 
dargestellt, urn beispielhaft ein Rekonfigurationsverfahren 
ahnlich der „Synchronisierten Pipeline" nach 11.2 zu 
verdeutlichen. Eine CT (2001) ist mehreren CT-Interface 
Baugruppen (2004) von PAEs (2005) zugeordnet. 2004 ist in 2005 
integriert und wird nur zur besseren Darstellung Funktion von 
WAIT und WCT abgesetzt dargestellt- Die Signale zur 
Obertragung der Konf igurationdaten von 2004 nach 2005 sind aus 
Grtinden der Abstraktion nicht dargestellt. 

Die CT ist mittels eines gepipelineten Bussystems an die 2004 
angebunden, wobei 2002 die Pipeline-Stufen darstellen. 2002 
besteht aus einem Register (2003b) ftlr die Konf igurationsdaten 
(CW) und einem weiteren Register (2003a) rait integriertem 
Dekoder und Logik. 2003a dekodiert die in CW tibertragenen 
Adresse und sendet ein Signal RDY an 2004 , sofern die 
betreffende lokale PAE adressiert ist, bzw. ein Signal RDY an 
die nachste Stufe (2002), sofern die lokale PAE nicht 
adressiert ist. Dementsprechend nimrat 2003a die Quittierung 
(GNT), ausgeftihrt als RPY/ACK gemafi dem bekannten Protokoll, 
entweder von 2002 oder von 2004 entgegen. 

Dadurch entsteht ein gepipelineter Bus, der die CW von der CT 
zur adressierten PAE und deren Quittung zuriick zur CT 
tibertragt . 
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Wenn WCT bei 2004 aktiv ist, werden die anstetienden CW, die 
besGhreibungsgemafi mit WAVE gekennzeichnet sirid, in 2004 
konfiguriert, GNT wird mit. ACK quittiert. 
Solange WCT nicht aktiv ist, aber CW zur Konfiguration 
anliegen, wird GNT nicht quittiert f d.h. die Pipeline ist bis 
zur Durchftihrung der Konfiguration blockiert. 
Erwartet 2005 eine Wave-Rekonf iguration, . gekennzeichnet durch 
ein aktives WCT und keine mit WAVE gekerihzeichneten CW liegen 
bei 2004 vor, quittiert 2004 mit WAIT urn die PAE (2005) 
solange in einen wartenden, nicht datenverarbeitenden Zustand 
zu versetzen, bis mit WAVE gekennzeichnete CW in 2004 
konfiguriert wurden. 

CW r die nicht mit WAVE ttbertragen wurden, werden wahrend der 
Datenverarbeitung mit RE J zuriickgewiesen. 

Es soil angemerkt sein, da£ diese Figur ausschlieMich das 
Grundprinzip verdeutlichen soil. Durch applikationsabhSngige 
besondere Ausgestaltungen konnen Optimierungen durchgeftihrt 
werden. Beispielsweise kann durch eine Registerstufe in 2004, 
die eingehende mit WAVE gekennzeichnete CW bis zum Eintref fen 
von WCT und der damit verbundenen Rekonf iguration 
zwischenspeichert, das Blockieren der Pipeline verhindert 
v/erden, wenn von der CT gesendete CW nicht s of or t von der 
adressierten 2004 abgenommen werden. 

2010 und 2011 sollen die Richtung der Datenverarbeitung zur 
weiteren Eriauterung kennzeichnen. 
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Sofern die Datenverarbeitung in Richtung 2010 veriauft, 1st 
eirie' schhelle Wave-Rekonfi^utatioh der PAEs wie folgt moglich: 
Die CT sendet die mit WAVE . gekennzeichneten CW derart in die 
Pipeline, daB zunachst die CW der am weitesten entfernten PAE 
gesendet werden. Sofern die CW nicht sofort konfiguriert 
werden k6nnen ist die entfernteste Pipeline-Stufe (2002) 
blockiert. Danach sendet die CT die CW an die nunmehr 
entfernteste PAE und so weiter, bis zuletzt die Daten an die 
nachste PAE gesendet werden. 

Sobald ChkPkt durch die PAEs lauft konnen jetzt in jedem Takt 
die neuen CW konfiguriert werden. Das Verfahren ist auch dann 
effizient, wenn ChgPkt zeitgleich mit der Obertragung der CW 
von der CT durch die PAEs lauft, da auch dabei das jeweils zur 
Konfiguration erforderliche CW an der jeweiligen PAE in jedem 
Takt anstehen kann. 

Verlauft die Datenverarbeitung in die entgegengesetzte 
Richtung (2011), kann ebenfalls die Pipeline von der der CT 
entferntesten PAE zu der der CT nSchsten PAE konfiguriert 
werden. Sofern ChgPkt nicht zeitgleich mit der 
Datentibertragung der CW erfolgt, bleibt das Verfahren optimal, 
da bei Auftreten von ChgPkt die CW sofort aus der Pipeline in 
die 2004 Qbertragen werden kann. 

Erscheint ChgPkt jedoch zeitgleich mit den CW der Wave 
Rekonfiguration, entstehen Wartezyklen. Beispielsweise soil 
beim Auftreten von ChgPkt zum Takt n die PAE B konfiguriert 
werden. Die CW stehen an und werden in 2004 konfiguriert. Beim 
Takt n+1 liegt ChgPkt (und damit WCT) bei PAE C an. Die CW von 
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PAEC werden aber in diesem Takt bestenfalls erst in 2002 von 
PAE B tiberirageri, da im vorhergehenden Takt 2002 von PAE B 
noch mit deren CW belegt war. Erst im Takt n+2 liegen die CW 
von PAE C in deren 2002 und konnen konfiguriert werden. In 
Takt n+1 ist ein Wartezyklus entstanden. 

Figur 21 zeigt die allgemeinste Synchronistionsstrategie fur 
eine Wave-Rekonfiguration. Eine erste PAE 2101 erkennt die 
Notwendigkeit einer Rekonfiguration aufgrund eines 
auftretenden Zustandes. Das Erkennen kann nach gew6hnlichen 
Verfahren/ beispielsweise einem Vergleich von Daten Oder 
Zustanden erfolgen. Durch das Erkennen sendet 2101 ein 
Aufforderung (2103), die durch einen Trigger erfolgen kann f an 
eine Oder mehrere zu rekonf igurierenden PAEs (2102), das die 
Datenverarbeitung anhait. Weiterhin sendet 2101 ein Signal 
(2105), das auch dasselbe Signal 2103 sein kann) an eine CT 
(2104), urn diese zur Rekonfiguration auf zuf ordern. 2104 
rekonf iguriert 2102 (2106) und informiert (2107) nach 
erfolgter Rekonfiguration aller zu rekonf igurierenden PAEs 
2101 gegebenenfalls mittels Rekonfiguration uber die 
Beendigung der Durchf tihrung . Daraufhin nimmt 2001 die 
Anhalteauf forderung 2103 zuriick und die Datenverarbeitung wird 
fortgesetzt. 2108 und 2109 symbolisieren jeweils Daten^- und 
Trigger- Ein- und AusgSnge. 

Figur 22 veranschaulicht eine Mdglichkeit durch Routing- 
Mafinahmen fiir eine korrekte zeitliche Weiterleitung von WCT zu 
sorgen. Von einer zentralen Instanz (2203) werden mehrere WCT 
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fiir verschiedene PAEs (2201) generiert, die jedoch zeitlich 
aufeiriander abgestimmt sein sollen. Die unterschiediichen 
Entfernungen der 2201 in der Matrix ftthren zu - - 
unterschiediichen Laufzeiten, bzw. Latenzzeiten. Dies wird in 
dem vorliegenden Beispiel durch das geeignete Einsetzen von 
Pipelinestufen (2202) durch den, dem Compiler zugeordneten 
Router, erreicht (vgl. PACT13) . Die sich dadurch ergebenden 
Latenzen sind mit dl-d5 anigegebeii. Es ist ersichtlich, dafi in 
Richtung des Datenflusses (2204) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 2205 nicht 
notwendig/ da die Entfernung von 2206 von 2203 sehr gering 
ist. Da aber fiir 2207 und 2208 je ein 2202 aufgrund der durch 
die langere Distanz entstehenden Laufzeit eingefttgt werden 
mufi, wird 2205 zum Abgleich der Laufzeit notwendig. 

Figur 23 soil eine Anwendung der Wave-Rekonf iguration 
aufzeigen. Dabei soil ein wesentlicher Vorteil der VPU- 
Technologie aufgezeigt werden, namlich die wahlweise Nutzung 
von PAE-Ressourcen oder Rekonfigurationszeit zur L5sung einer 
Aufgabe, woraus sich ein vom Compiler bzw. Programmierer 
einstellbarer intelligenter Tradeoff zwischen Kosten und 
Performance ergibt. 

Ein Datenstrom soli (2301) in einem Array (2302) aus PAEs 
(2304-2308) berechnet werden. Dem Array ist eine CT (2303) 
zugeordnet, die fiir dessen Rekonf iguration zustSndig ist. 2304 
ist fiir die Erkennung des Endzustandes der Datenverarbeitung 
der eine Rekonf iguration erf order lich macht zustandig. Die 
Erkennung wird an die CT signalisiert . 2306 kennzeichnet den 
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Beginn und 2309 das Ende einer Verzweigung, die durch (2307a, 
2307b, t>zw. 2307ab) symbblisiert 1st. Die PAEs 2308 wefderi 
nicht yerwendet. Die unterschiedlichen Trigger werden durch 
2309 dargestellt. 

In Figur 23a wird durch 2305 einer der beiden Zweige 2307a, 
2307b selektiert und per Trigger zeitgleich mit den von 2306 
eintreffenden Daten aktiviert. 

In Figur 23b soli aus 2307a und 2307b nicht komplett 
vorkonfiguriert sein, sondern beide mdglichen Zweige sollen 
sich die Ressourcen 2307ab durch Rekonf iguration teilen. 2305 
selektiert weiterhin den filr die Datenverarbeitung notwendigen 
Zweig. Die Information wird jetzt einerseits an 2303 gefuhrt, 
andererseits an 2306, um gemSB Figur 21 die Datenverarbeitung 
bis zur komplett durchgefiihrten Rekonfiguration von 2307ab 
anzuhalten. 

Figur 24 stellt eine mSgliche alternative Implementierung 

gemSB 4.2 einer Statemachine zur Ablauf steuerung der PAE dar: 

Folgende Zustande sind implementiert : 

Not Configured (2401) 

Allocated (2402) 

Wait for Lock (2403) 

Configured (2404) 

Folgende Signale 16sen eine ZustandsSnderung aus: 
LOCK/FREE (2404, 2408) 
CHECK (2405, 2407) 
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RECONFIG (2406, 2409) 

go (24io f 2411) ; : ; 

Pigur 25 zeigt den aus PACT 13 bekannten Aufbau eines 
Hochsprachencompilers, der beispielsweise auch gewShnliche 
sequentielle Hochsprachen (C, Pascal, Java) auf ein VPU-System 
iibersetzt. Sequentieller Code (2511) wird von parallelem Code 
(2508) getrennt, wodurch 2508 direkt in dem Array von PAEs 
verarbeitet wird. 

Fiir 2511 gibt es drei Ausftihrungsmoglichkeiten: 
1. Innerhalb eines Sequenzers einer PAE (vgl. PACT13, 2910) 
2; Mittels eines in die VPU konf igurierten Sequenzers. Der 
Compiler erzeugt hierzu einer seits einen auf die Aufgabe 
optimierten Sequenzer, andererseits direkt den 
algorithmenspezifischen Sequenzercode (vgl. PACT13, 2801) . 

3. Auf einem gew5hnlichen externen Prozessor (vgl. PACT 13, 
3103) 

4. Durch schnelle Rekonf iguration mittels einer CT, indem das 
Verhaltnis zwischen der Anzahl der PAEs innerhalb einer PAC 
und der Anzahl der PACs derart gewShlt wird, daft eine Oder 
mehrere PACs als dedizierte Sequenzer aufgebaut werden k6nnen f 
dessen Opcodes und Befehlsausftlhrung von der zugeordneten CT 
in jedem Arbeitsschritt kpnfiguriert werden. Dabei reagiert 
die zugeordnete CT auf den Status des Sequenzers, um den 
jeweils nachfolgenden Programmablauf zu bestimmen. Die 
Obertragung des Status erfolgt mittels des Triggersystems . 
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Weiche MSglichkeit gewShlt wird, hSngt von der Architektur der 
VPU, des Computersystems und des Algorithmus ab. 

Das Prinzip ist aus PACT 13 bekannt. Es soil jedoch 
ausdrticklich auf die Erweiterungen des Routers und Placers 
(2505) entsprechend der hier vorliegenden Offenbarung 
hingewiesen werden. 

Der Code (2501) wird zunachst in einem Pr&prozessor (2502) in 
Datenf luficode (2516) (der in einer speziellen Version der 
jeweiligen Programmiersprache datenf luBoptimiert geschrieben 
wurde) und gewohnlichen sequentiellen Code getrennt (2517) . 
2517 wird auf parallelisierbare Teilalgorithmen untersucht 
(2503) , die sequentiellen Teilalgorithmen werden ausgesondert 
(2518) . Die parallelisierbaren Teilalgorithmen werden als 
Makros vorlaufig plaziert und geroutet. 
In einem iterativen Prozess werden die Makros mit dem 
datenf luBoptimierten Code (2513) zusammen plaziert/ geroutet 
und partitioniert (2505) . Eine Statistik (2506) wertet die 
einzelnen Makros, sowie deren Partitionierung hinsichtlich der 
Effizienz aus, wobei die Umkonfigurationszeit und der Aufwand 
der Umkonf iguration in die Ef fizienzbetrachtung einflielit. 
Ineffiziente Makros werden entfernt und als sequentieller Code 
ausgesondert (2514). 

Der verbleibende parallele Code (2515) wird zusammen mit 2516 
compiliert und assembliert (2507) und VPU Objektcode 
ausgegeben (2508) . 
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Eine Statistik tiber die Effizienz des generierten Codes, sowie 
der einzelnen (auch der mit 2514 entfernten Makros) wird 
ausgegeben (2509), der Programmierer erhalt dadurch 
wesentliche Hinweise auf Geschwindigkeitsoptimierungen des 
Programmes. 

Jedes Makro des verbleibenden sequentiellen Codes wird auf 
seine Komplexitat und Anforderungen untersucht (2520) Aus 
eiher Datenbarik die von der VPD-Architektur und dem 
Computersystem abhangt (2519) wird der jeweils geeignete 
Sequenzer ausgewahlt und als VPU-Code (2521) ausgegeben, Ein 
Compiler (2521) generiert den Assembler code des jeweiligeh 
Makros fur den jeweils von 2520 gewShlten Sequenzer und gibt 
ihn aus (2511) . Die 2510 und 2520 sind eng miteinander 
verkntipft. Gegebenenfalls verlauft die Abarbeitung iterativ urn 
den geeignetsten Sequenzer mit minimalsten und schnellsten 
Assemblercode zu finden. 

Ein Linker (2522) fafit die Assemblercodes (2508 f 2511, 2521) 
zusammen und generiert den ausftihrbaren Objektcode (2523) . 
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Begxiff sdef inxtionen 

ACK/REJ QuittierungsprotokolJ einer PAE auf einen< : 
(Re) Konfigurationsversuch. ACK zeigt an dafi die 
Konfiguration angenommen wurde, REJ zeigt an daft die 
Konf iguration abgelehnt wurde. Das Protokoll sieht vor, daB 
auf das Eintreffen von entweder ACK oder RE J gewartet wird 
und ggf . bis dahin Wartezyklen eingeftigt werden. 

CT Einheit zum interaktiyen kpnf igurieren und 

rekonfigurieren von kohfigurierbareh Elementeh. Eine CT 
besitzt einen Speicher zum Zwischenspeichern und/oder Cachen 
von SubConf . In besonderen Ausgestaltungen besitzen auch 
CTs, die keine Root-CT sind, diriekten Anschluft an einen 
Speicher ftir SubConf, der in diesem Fall nicht von einer 
dariiberliegenden CT geladen wird. 

CTTREE Ein- oder mehrdimensionaler Baum von CTs. 

EnhSubConf Konfiguration die mehrere SubConf, die auf 
unterschiedlichen PACs auszuftihren sind, beinhaltet. 

Konfiguration Kompletter ausftihrbarer Algorithmus. 

konf igurierbares Element Physikalisch beliebiges Element, 
dessen exakte Funktion innerhalb der implementierten 
Mdglichkeiten durch eine Konfiguration bestimmt wird. 
Insbesondere kann ein konf igurierbares Element als logische 
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FunktibnseinheitV arithmetische' Furiktionseinheit, Speicher, 
peripheres Interface./ Bus system 'ausgestaltet seih; wobei 
besonders Elemente bekannter Technologien wie FPGAs (z.B. 
CLBs), DPGAs, VPUs und samtliche unter „reconfigurable 
computing" bekannte Elemente eingeschlossen sind. Ein 
konfigurierbares Element kann auch eine komplexer 
ZusamraenschluB mehrerer unterschiedlicher Funktionseinheiten 
sein, z.B. einer arithmetischen Einheit mit integrierteiri 
zugeordnetem Bussystem. 

KW Konf igurationswort . Ein oder mehrere Daten, die die 
Konfiguration Oder einen Teil einer Konfiguration eines 
konfigurierbaren Elementes bestimmen* 

Latenz Verzogerung innerhalb einer Datentibertragung, die 
gewohnlicherweise in synchronen Systemen taktbasierend 
erfolgt und daher in Taktzyklen angeben wird. 

PA Processing Array, Anordnung mehrerer auch unterschiedlich 
ausgestalteter PAEs 

PAC Ein PA mit der zugeordneten far die Konfiguration und 
Reconfiguration dieses PAszustSndigen CT 

PAE Processing Array Element , konfigurierbares Element 
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ReconfReq Trigger auf grund eines Zustandes der eine 

Rekorifiguration erfordert gerieriert werden und selbigen 
kennzeichnen; 

rekonf igurieren Laden einer neuen Konf iguration, ggf . 
zeitgleich oder Oberlagernd Oder parallel zu einer 
Datenverarbeitung, ohne die ablaufende Datenverarbeitung zu 
behindern oder zu verfalschen. 

Root-CT H5chste CT im CTTREE, besitzt fiir gew5hnlich aber 
nicht ausschliefilich als einzige CT einen Anschlufi an den 
Konf igurationsspeicher . 

SubConf Teil einer Konf iguration bestehend aus mehreren KW. 

WCT Kennzeichnet den Zeitpunkt zu dem eine Rekonf iguration zu 
erfolgen hat. Kann dabei optional durch Obertragung einer 
zusatzlichen Information eine aus mehreren moglichen 
Konf iguration auswShlen. Ftir gew6hnlich verlSuft WCT exakt 
synchron mit dem Beenden der aktuell laufenden und zur 
Rekonf iguration zu beendenden Datenverarbeitung. Wird WCT 
aus Implementierungsgrtinden spater ubertrageh, wird WCS zur 
Synchronisierung der Datenverarbeitung verwendet. 

WCP Fordert eine oder mehrere alternative nachste 

Konf iguration (en) bei der CT zum (Re) konfigurieren an. 
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WCS Stoppt die Datenverarbeitung bis zum Eintreffen von WCT. 
MuB nur verwendet werden, wenn in^lemenfeierungsbedingt WCT 
nicht exakt den Zeitpunkt der erforderlichen Rekonfiguration 
anzeigt, sondern erst nach dem eigentlichen Ende der 
Datenverarbeitung der zu beendeten Konfiguration bei der 
jeweilgen PAE eintrifft. 

Zelle konf igurierbares Element 
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Patentanspriiche 

1. Verfahren zum Betrieb einer Datenverarbeitungseinrichtung 
mit ein- ocler mehrdimensionaler konfigurierbarer Zellstruktur, 
dadurch gekennzeichnet daB 

zusammen mit den Konfigurationsdaten ein Flag gesendet wird, 
das anzeigt, daB eine Zelle neu konfiguriert wird, wobei die 
Zelle daraufhin die Konf iguration annimmt sofern sie sich in 
eiriem linkonf igurierten Zustand bef and und ansonsten die 
Konf iguration verweigert. 

2. Verfahren zum Betrieb einer Datenverarbeitungseinrichtung 
mit ein- oder mehrdimensionaler konfigurierbarer Zellstruktur, 
dadurch gekennzeichnet daB 

zusammen mit den Konfigurationsdaten ein Flag gesendet wird, 
das anzeigt, daB eine Zelle teilweise konfiguriert wird, wobei 
die Zelle daraufhin die Konf iguration annimmt sofern sie sich 
in einem konfigurierten Zustand befand und ansonsten die 
Konf iguration verweigert. 

3. Verfahren zum Betrieb einer Datenverarbeitungseinrichtung 
mit ein- oder mehrdimensionaler konfigurierbarer Zellstruktur, 
dadurch gekennzeichnet daB 

eine Zelle durch ein bestimmtes Flag gestartet wird. 



113 



WO 02/13000 



1/22 



PCT/EP01/06703 



G) 

MM" 

JUL 



© 
© 





o 

i 


o 

1 

CM 


O 
i 

CO 


o 

1 


1 


CM 
i 


CM 
i 

CM 


CO 
1 


CO 
1 

CM 


CO 
i 

CO 


CO 


CO 
1 

in 


o 


























CD 








* 


* 




* 










* 






* 


* 


* 






* 




* 


* 






O 


* 










* 




* 











WO 02/13000 



2/22 



PCT/EP01/06703 



CD 



CM 
O 
CM 
O 



CM 
O 
I 

I 



CO 

o 

CM 

o 



CM 

D) 
LL 



Ul 

o 



CM 



CO I o 
i n 1 

i- f eg 



o 

i 

CO 



CO 
I 

CM 



CO 

I 

CO 



CO 
I 



o 

I 



CM 
i 

CM 



CO 
i 

in 



I 
I 



WO 02/13000 



3/22 



PCT/EP01/06703 



0302 



8 

0304-^ 



0305 



Oi 

CO! 



© 

CO 




Fig. 3 



c 


D 


G 


CW-PAE 


* 






1-0 


nop 


nop 


nop 


* 




* 


1-1 




* 




2-0 




* 




3-0 






* 


4-0 


* 






1-2 


nop 


nop 


nop 


* 






1-3 




* 


* 


2-2 


nop 


nop 


* 






1-4 




* 




2-3 








3-3 




* 




4-3 




* 




5-3 




* 


* 


6-3 




* 


* 


2-4 


nop 



WO 02/13000 PCT/EP01/06703 

4/22 




WO 02/13000 



5/22 



PCT/EP01/06703 




WO 02/13000 



6/22 



PCT/EP01/06703 




WO 02/13000 



7/22 



PCT/EP01/06703 




WO 02/13000 



8/22 



PCT/EP01/06703 



1004h 1005b 



iZ 




1004a 1005a 



WO 02/13000 



9/22 



PCT/EP01/06703 



1004h IQQSh 



■ ■Mi 

LL 





1004g 1005g 




1004e 1005e 




1004d 1005d 



1004c 1005c 



1004b 1005b 




1004a 1005a 



WO 02/13000 



PCTVEP01/06703 



10/22 



Fig. 12a Fig. 12b 




WO 02/13000 



11/22 



PCT/EP01/06703 



CO 
CO 



■ MB . 

U- 




1004a 1005a 



WO 02/13000 



12/22 



PCT/EP01/06703 




WO 02/13000 



13/22 



PCT/EP01/06703 




WO 02/13000 



14/22 



PCT/EP01/06703 




WO 02/13000 



15/22 



PCT/EP01/06703 




WO 02/13000 



17/22 



PCT/EP01/06703 





WO 02/13000 



18/22 



PCT/EP01/06703 



a: 



2002 a 2003b 



c 



(3 



CM 



2002 a 2003b 



c 



CD 



5 



2002 a 2003b 



5 L 

CD 



© 
© 

CM 



,WCT 



CM 



«W CT 



2002 a 2003b 



a 

I 
I 
I 

L 



CM 



WAIt. 



«WCT 



CM 



«WCT 



CM 



WAI1 



,WCT 



ID 



CM 



.WCT 



o 
o 

CM 



WAI^ 
„ WCT 



CM 



,WCT 



o o 

CM CM 



< 
LU 

t t 



LU 

< 

a. 

t * 

o 

LU 
< 

a. 

LU 
< 

a. 



WO 02/13000 



19/22 



PCT/EP01/06703 




2104 


uv 

o . _ 

£ t 


'2107 


Jg 


2101 


2103 


210? 



CM 

d) 

■ ■■ 

ti- 



ll 08 



[109 



WO 02/13000 



PCT/EP01/06703 



20/22 




O 

CO 
CM 



o 

CO 
CM 




If) 

o 

CO 
CM 



CD 

o 

CO 
CM 



CO 

o 

CO 
CM 



n 
o 

CO 
CM 






00 

o 

CO 
CM 



O) 

o 

CO 
CM 



JQ 

o 

CO 
CM 






CM 

o 

CO 
CM 




CO 

CO 
CM 

d> 



WO 02/13000 



21/22 



PCT/EP01/06703 




WO 02/13000 



22/22 



PCT/EP01/06703 



CO 

to 

CM 



m 

CM 





o 




O 


CM 






in 




Ho 


CM 




CM 



CM 

m 

CM 



in 

CM 



in 




CO 


o 




o 


in 




in 


CM 




CM 



CO 

LO 
CM 




m 
In 

CM 




CM 
CM 

in 

CM 



CO 
.CM 

in 

CM 



LO 
CM 

il 



